中文垃圾站

中文垃圾站,相信大家都不陌生吧,百度的搜索结果经常被一些非常垃圾的网站占据。虽然百度对一些被发现的垃圾站进行了惩罚,但我相信,从成本和收益的角度来讲,这些垃圾站绝对是稳赚不赔的。百度算法的水平和Google还是有很大差距的,连Google都无法避免被作弊者操作,何况百度呢?其实说实在的,如果百度可以像Google一样正常优化的话,真的是不喜欢作弊的。但Google上的优化经验在百度上真的是不太管用,下了很大功夫写的文章,而且进行了推广,在Google上一般能表现不错,但百度上却莫名其妙的被删除收录了,而一些乱七八糟、不知所云的tag页面却收录的不错。所以决定做几个垃圾站来试试,看看效果如何。

上面是其中一个垃圾站的流量图,看着还可以,从建站开始到被百度K掉,大概一个半月的时间,流量随着页面数量的增加基本能够保持一直增加。下面跟大家分享一下我的一些思路。

首先,这个网站是垃圾站,所以被K是迟早的事,所以投入不要太大,最理想的结果就是程序一开,其他的什么都不用管了,等着来流量就可以了。

其次,网站靠什么来流量呢?这个根据网站的不同,定位肯定不同。有些人的垃圾站是站群,或者是在外链上搞其他动作,如群发、虚拟连接等,通过关键字的短暂排名来获得流量。我的思路靠网站内容,在内容上造假,制造大量的垃圾内容,从搜索引擎上获得长尾流量。

最后的问题就是如何通过程序来生成大量的垃圾内容了。我的思路是首先获得一份庞大的长尾关键字列表,然后从搜索引擎的搜索结果页中直接把搜索结果保存在本地数据库中,然后在网站上通过调用数据库中的内容生成静态页面来获得流量。这里利用的是搜索引擎的三个漏洞

一是搜索引擎对于网页内容语义上的识别还比较差的缺陷(搜索引擎毕竟不是人,还无法知道这些文字组合在一起到底有没有意义,可读性如何)。

二是利用搜索引擎对于原创内容权重的提升(搜索引擎对于原创文章会给予比较高的权重,而搜索结果页是根据用户输入的搜索词生成的,搜索引擎不可能将这些搜索结果页都存储下来以判断是否有人采集这些内容)。通过这两个漏洞,一些本来很垃圾的采集内容就被搜索引擎错误的当成高权重的原创内容了。

三是搜索引擎有个原则,就是对新站会有一定的展示照顾。因为一个新站,搜索引擎用来排名的很多参考因素都是空白的时候,尤其是用户体验方面的数据。它会本着“人之初、性本善”的原则,对新站的这些空白数据予以比较高的值,这样新站就能得到比较多的展示机会。随后,搜索引擎会根据新站在展示过程中的表现,来收集用户行为,补充这些空白数据。所以,一个新站内容越多,这个时候能得到的展示机会就越多,抓住这个机会,一个垃圾站的成本就肯定能收回了。

这些垃圾站看似挺好的,但是为什么有些垃圾站会被惩罚呢?主要原因就在于搜索引擎对于用户行为的收集。因为一个站垃圾不垃圾,用户最知道了,骗过搜索引擎容易,想骗过网站的用户可就不容易了。Google、百度获取用户行为数据的来源很多,比如,Google管理员工具或百度管理员工具,Google的浏览器,Google、百度的统计工具等(现在明白了搜索引擎为什么会下功夫来开发一些免费的东西让用户使用了吧,都是为提高搜索质量来服务的)。如果你的垃圾站的这些用户行为信息被搜索引擎搜集到了,那么离被惩罚应该已经不远了。

但说实在的,一些高手在用户行为上也是可以作假的,比如通过病毒来控制很多电脑,即传说中的“肉鸡”,让这些电脑想访问正常网站一样来访问自己的垃圾站,影响搜索引擎的对垃圾站的判定数据。不过,我现在还没到这个水平,未来努力的方向吧。

当然,搜索引擎还保留了最后一张王牌——人工审查。所以,做垃圾站要低调,一旦被人工审查了,做的再好也没用。

贾定强微信

微信扫一下,或点击链接添加好友