百度官方:spider抓取的网页大小上限和索引内容上限问题

例如,spider抓取的网页大小上限和索引内容上限问题。

“如果页面的大小跟SEO的抓取之间没有必须的联系,那么,就不应该告诉我们网页的大小应该限制在一定的范围内。因为这样,不是我们的网页愿不愿意被你抓取,而是你百度能不能把我们的网页抓取。但是按照你后面的回答,说明两者还是有联系的,既然有联系,那就应该告诉一个明确的数字,130K?100K?还是 80K?因为它会跟另一个问题——快照显示程度是否完整,决定站长是否要跟对方交换链接有明确的关系。”

这类问题不宜给出确切值,是有原因的。因为这种数字,不是一成不变的。我今天说100兆,说不准明天改成1000兆,那我该怎么办?一一的通知到各位?显然是不可能的。所以我只能说,这个数字很大,大到诸位完全不必去有任何担心,比如底部链接无法提取之类。这种上限的设置,肯定会是根据互联网的实际情况,研究分析所得,而不是拍脑袋定的。并且随着网络推广服务的变化,这种阈值也会发生相应的变化。

很多策略也是同理。比如有人要是问我说,加粗的term,是否会有更高的权重?我该怎么回复呢?我说是,就会有一堆人去搞加粗SEO,结果使得这个互联网特征的可用性大降,增加了策略复杂度。并且如果再实施一些精细化的过滤措施,又会有人跳出来说,Lee胡说八道,我实验过了,加粗没有任何权值变化。我如果说否呢?如果哪天百度真的使用这个特征了,又有人跳出来说,我实验过了,证明百度是对这个东西加权的,Lee就是在胡说八道。总之,我不管说是,还是说否,都里外不是人。

所以说,很多站长只是站在网络营销的利益角度,对搜索引擎横加鞭笞,却很少去站在用户利益,以及搜索引擎如何健康发展的角度,来理性的分析很多问题。我们之所以不愿意这个小地方加很多人,原因也在于此。

对于很多问题,我们只能给一些倾向性的说明。搜索引擎喜欢什么,不喜欢什么。而没法跟诸位说,喜欢到什么程度,具体到多少阈值。这不是这个小俱乐部的讨论范畴,也不是任何一个成熟的搜索引擎与站长的打交道方式。
 


  • 相关文章:
« google再次严惩链接购买行为Wordpress博客表情符号 »

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

最近发表
SEO文章分类
最近评论
最近留言
标签TAGS