不同关键词不同快照原因

发表评论 1 条 条评论 发布:jiangwei 发表时间:2012-01-18 标签:
 

不同关键词,不同快照原因,经常看到网上在讨论:搜索不同的关键词,出现结果中的百度快照不同的情况,就是显示的快照时间不同。这种现象好像对首页出现的特别多,很多人觉得是快照回档,接着影响降权等N多猜测。。。本人也见过这种现象,不过一直也没怎么深究,不过今天看到一篇关于网络爬虫的文章,里面说到的一些东西或许可以解释这个现象。

一:百度搜索“按钮开关符号”
pic1.jpg

显示快照时间:1-7 查看百度快照:网页中仅一处地方出现“按钮开关符号”
pic2.jpg

二:百度搜索“按钮开关型号”
pic3.jpg

显示快照时间:1-17 查看百度快照,同样的,仅一处地方出现”按钮开关型号“
pic4.jpg

我们可以发现,上面就出现了针对不同关键词,出现了不同百度快照的情况。同时需要说明的是:网页其他所有内容均为变化,只有新闻中心一处的改变。同时在1-7搜索”按钮开关型号“时没有排名,而在1-17搜索”按钮开关型号”时,排名在第一页。
其实这个是我一开始测试关键词排名的,结果证明这样操作确实有效。。。

继续正题,那是设么原因出现了这种不同关键词,不同快照的呢。很显然,在网页内容改动后,对于第一个词“按钮开关符号”的排名应该会出现波动或者消失,但是百度却使用了1-7的网页快照来进行排序。而对于“按钮开关型号”一词,则用了1-17的网页快照进行排序。

个人认为,原因是由于网络爬虫的网页更新策略导致的。所谓爬虫更新策略,是指由于互联网网页处于不断变化中,页面内容的更改很频繁,对于爬虫来说,并非将网页抓取到本地就算完成任务,为了体现动态性和及时性,任然需要对这些页面进行不断的重新抓取。但由于资源,时间等限制因素,需要一套策略保证在有限条件下抓取尽可能多且高质量的内容。因为需要一些良好的更新策略。

主流的更新策略有三种,历史参考策略,用户体验策略,聚类抽样策略。对于不同关键词,不同快照所产生的最大可能就是用户体验策略所导致的。

用户在提交搜索查询后,对于搜索结果,一般只查看前三页搜索内容。用户体验策略就是利用搜索用户的这一特性来设计更新策略的。这种更新策略以用户体验为核心,即使贝蒂索引网页内容(即网页快照)是过时的了,但是如果不影响用户体验,那么晚些更新这些网页也未尝不可。此时判断一个网页何时更新为好,取决于这个网页的内容变化所带来的搜索质量变化。影响越大的网页,更新越快!

重点来了:用户体验策略保存网页的多个历史版本,并根据内容的变化对搜索质量的影响来决定更新频率。所以在这个情况下,由于不同网页快照版本的存在,会对不同的查询出现不同的结果,但是时机一到,还是会进行相应的更新调整。所以说对不同关键词,出现不同快照的情况是基于用户体验考虑出发的结果。


所以我相信过几天,上面案例网页对于“按钮开关符号”的排名会消失。到时候告诉大家 是不是这样的 而对于该现象经常出现在网站首页,也可以理解为首页的更新策略所决定,更新更为频繁。

文章作者:jiangwei
本文地址:http://www.fuzhouseoer.com/butong-guanjiaci-butong-kuaizhao/
版权所有 © 转载时必须以链接形式注明作者和原始出处!

发表评论

*

* 绝不会泄露


Protected by WP Anti Spam