首页 / 互联网络 / 正文
 

Mojeek获得投资,部署100台新服务器

SEO实验室 2019-12-6 15:4:24 互联网络 0 评论
正文 点这评论

以隐私为核心的英国搜索引擎Mojeek宣布了新的投资,并计划在改进搜索引擎算法的同时将索引增加到80亿页。选择是件好事。在过去的15年里,这个世界有点太依赖谷歌了,从一个角度来看待世界的信息不如从更多的角度看到它那么好。

非常值得称道的是,竞争只会对我们(站长)有利--尤其是英国的。

不过,我很快就会想到:

搜索引擎似乎痴迷于大小--我理解为什么,这和人们在社交媒体上评价自己的数量是一样的。

我想,如果你能开发一个算法,甚至一个手动系统来识别那些能发布数百万页的网站.一旦发现它们,你就可以把它们放到一个不爬行的列表中,然后把它们从索引中删除--是的,你的索引会少数百万页(每个站点都被屏蔽了),但它可以节省时间和资源--此外,它也是清除SERPS中一些垃圾的好方法。也许,如果你是慈善的,一年后你可以再查一查,看看网站是否改变了方式--但我想说,永久的禁令会更有意义,毕竟,如果搜集和重新发布是你的商业模式,你不会很快改变它,你不可能花太多的钱来写出真正的原创内容。

这是一个潜在的问题,复制内容和原始内容。不幸的是,原始内容的纯情况是谁首先发布它,或者在爬虫的情况下,从一个特定的参考框架(在本例中是搜索引擎)中首先看到的版本。

就我个人而言,我会大力提倡一种独特内容的校验和存储库,比如64位的唯一内容跨度的散列,只是为了出版商说“我做了这件事”。我很惊讶这样的事情还没有成为网络标准。我不是中央集权主义的粉丝,但拥有某种权威的独特内容将是一件很棒的事情。我听说过这方面的一些“推送”方法来验证新的内容,但是没有什么是实质性的。

在一些专门的搜索中,它们会显示一个顶级链接,但是当我搜索我通常可能寻找的东西类型时,比如小部件商店、城市、状态,它们都很难看。许多不相关的东西,如“目录”的不同类型的商店,NSFW在另一个国家,和完全不同的主题。

(完)

 

猜你喜欢

发表评论

必填

选填

选填

必填,不填不让过哦,嘻嘻。

记住我,下次回复时不用重新输入个人信息

最近发表
网站分类
网站收藏
SEO实验室
在线咨询QQ咨询
扫一扫扫一扫