Google Panda 更新那点事

在开始阅读这篇文章之前,您需要知道的是,任何针对英文Google 的算法调整最终会迁移至中文Google,类似的算法调整在不久的时间内百度也会跟进,所有提升搜索引擎用户体验的工作不管哪个搜索引擎都会去做。

在开始将Google Panda 之前,我们先来了解下Google Panda 的来历。09年的时候Google进行了咖啡因(Google Caffeine)的更新,主要解决了谷歌的抓取和索引速度。让谷歌可以获取的更加新鲜的内容(比如我的博客,一般会在3分钟内被谷歌抓取和索引)。但是 快速的抓取和索引使网页质量判断明显下降,很多无用或者重复性质的内容被索引进去。也就是Google所称的shallow-content site 肤浅内容的网站,在这些内容里面大多是伪原创的文章,也可能是一些没有参考价值的原创的内容。

针对搜索结果页的页面质量,谷歌先前推出的Google +1 也是为了解决这方面的问题。但是这对于判断一个网页的内容质量肯定不是一个完整的解决方案,于是Google Panda出现了,并且它将不断的进行算法更新。Google panda的主要目的就是剔除那些低质量的页面。即一个有效的页面过滤机制(类似百度的页面价值判断)。需要说明的是Google Panda不是针对站点的惩罚,而是通过算法进行排名的调整。与此同时,原创内容和信息将获得更好的排名,如研究、深度报道和周到详见的分析等。

Google Panda的设计原理会是哪些?

  1. 进行定性研究(这是讲的个人,而不是一个很大的问卷),找出它们认为质量差得原因。通过算法将此部分页面排除掉。
  2. 使用结果来定义因素,将谷歌测量出来的低质量的页面进行分析建模。来匹配哪些质量差的页面。

从大量的Google Panda的讨论文章来看,Google Panda主要的判断依据是点击流(Clickstream)、页面内容(page content)和链接概况(link profiles),只要在这三者当中表现优异,就不会被列为肤浅的网站。从大量的分析看,目前Google Panda的适用级别为网页级别,并没有细化到关键词级别。同时大量低质量页面也会在无形中给整个站点带来影响。

点击流

准确的说应该是考察的是用户参与度,或者是用户针对页面的反馈信息。主要考察指标可能是:

1、页面跳出率与页面停留时间或者回访率

数据来源:Google Analytics,Google Toolbar和搜索结果页不同链接的点击时间间隔。

单纯的跳出率不能反映页面的质量,比如说我的博客文章,用户可能看了一篇文章就达到了预期的效果,如果停留时间可可以作为参考依据。只有当两个条件(跳出率高且停留时间短)同时满足时,Google才会判定这个是个肤浅的网站。

2、被大量用户屏蔽的网站

数据来源:Google Chrome插件:Personal Blocklist (by Google)

Personal Blocklist官方介绍:Personal Blocklist扩展会将您希望阻止显示的网址样式提交给Google。当您阻止或者允许一个网址样式显示时,该扩展同时也会将展示此被阻止或者被允许的网址的搜索结果网 页提交给Google。您同意Google可以自由使用此信息来改进我们的产品和服务。

3、社会化网络当中的链接流行度

数据来源:Google自己抓取主流的社会化网络中的链接,如Twitter、Facebook、delicious等。

页面内容

Google肯定会针对页面进行分析,主要考察的是页面中信息量。可能考察的信息为:

  1. 网站或页面是否存在大量的重复内容
  2. 网站或网页内包含的原创内容的占比
  3. 是否有大量的实质内容很少的页面存在
  4. 页面是否充斥大量无关广告,影响信息的接收
  5. 页面内是否有明显的SEO痕迹,有填充内容存在
  6. 如果是模板页面,模板页面的共有部分的数据量

链接情况

  1. 社会化网络中链接的流行度(前面已经提及)
  2. 是否存在大量的SPAM链接

如何应对Google Panda的更新?

  1. 查找网站内流量质量最差的页面,并将这些页面区隔开来。设法修改你的低质量页面,但是不要太过,如果太过了容易招来惩罚。
  2. 给你网站的页面分类,按类别去查看数据,比如说广告数量、低质量内容百分比。按照情况进行修改会对搜索引擎屏蔽。(对于Wordpress的站点,可以参考下我的网站的Robots.txt文件哈 http://www.biaodianfu.com/robots.txt
  3. 如果您的站点是采集过来的内容,尝试移除他们或使用robots.txt来禁止Google 爬取,并停止采集,手动添加原创内容。
  4. 修改网站内的链接,保证每个页面只有一个唯一的链接。保证链接的唯一型。
  5. 修改那些过度优化的页面。去除重复堆积的文字等。
  6. 做一些提高用户体验的修改, 让页面具有更好的可读性,如修改字体大小,字体样式,字体颜色等
  7. 在页面上添加用户可能感兴趣的内容,提供提供相关内容的链接。
  8. 到社交网站上推广你的站点,或在网页内添加社会化按钮便于用户分享。
  9. 检查网站广告的覆盖率,减少页面中广告的数量,去除弹出广告。
  10. 停止SPAM行为吧,SPAM伤身!
贾定强微信

微信扫一下,或点击链接添加好友