垃圾的百度转码声明。为了流量,百度真是不则手段,以提高用户体验为借口,把大量流量都留在自己平台。作为站长,看着自己的网站被百度转成乱七八糟,却又没有办法。
最近弄了个手机网站,本来都设置好跳转了,但垃圾的百度转码功能,硬是给用户展示自己转码过的web网页,怎么也跳不到手机网站上。查了百度的帮助文档,里面这个垃圾的百度转码声明。挨着把里面的几项都设置好了,还是不行。不知道是不是快照或缓存的问题,决定等半天再看看!
半天以后,百度终于不自动转码了,换成了版本选择提示,让你选择浏览手机版本还是本来版本。虽然还是有点别扭,但总是是比直接转码成乱七八糟的网页要好多了。
这么分析一下,百度的转码功能也是提前用蜘蛛抓取的,经过简化以后存在数据库里。当有访问者访问时直接返回百度缓存的页面。所以在做去除百度转码时,不能着急,需要等待蜘蛛的反应。
百度转码声明
1. web页面转码的意义?
互联网上融合了WEB和WAP两类网页资源,WEB网页资源占比远多于WAP网页,但目前绝大多数移动终端的浏览器都不能直接浏览WEB网页。因此,为确保WAP可用性,必须对WAP搜索结果中的WEB网页进行格式转换,转换为WAP网页,使其能在移动终端浏览器被浏览。百度的转码技术即是为实现此目的、服务于WAP搜索的附属产品,各大搜索引擎均拥有并提供类似转码技术。
2. 百度转码的策略?
为了最大程度解决WEB页面在手机上的可用性,转码须去除WEB页面中不能在手机浏览器上浏览的内容,和无法用WAP描述语言描述的部分内容,并将网页布局由2维布局适配为1维布局。
3. 站长小贴士
(1)如果觉得自己的站点转码效果不佳怎么办?
可以使用百度移动标注协议,在PC站点的html页面中加入百度的标注协议(注释形式),提升转码效果。该协议主要针对采用html规范制作的Web站点,以利于站长自助优化百度无线搜索访问其站点时的页面效果。
(2)如果不希望自己的站点被转码怎么办?
共有三种解决方案:
A. no-transform协议
TC支持的no-transform协议为如下两种形式:
a. HTTP Response中显式声明Cache-control为no-transform。
b. meta标签中显式声明Cache-control为no-tranform,格式为:
<head>
<meta http-equiv=”Cache-Control” content=”no-transform ” />
</head>
如第三方站点不希望页面被转码,可添加此协议,当用户进入第三方网站时,先进入中间提示页,页面将引导用户自主选择跳转至原网页。
B. handheld协议
页面通过lt;link>标签显式指定WAP网页,声明格式如下:
<link rel=”alternate” type=”application/vnd.wap.xhtml+xml” media=”handheld” href=”target”/>
如第三方站点不希望页面被转码,可添加此协议,告知我们原网页对应有一个WAP版页面,当用户进入第三方网站时,先进入中间提示页,让用户自主选择跳转至原网页或第三方网站自有的wap页面。
C. User-Agent相关
TC抓取页面时,使用的User-Agent为:
Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.0; baidu Transcoder;)
如第三方站点不希望转码HTML页面,且又可以提供对应的自有WAP页面,则可以根据这个User-Agent,返回自有WAP页,同时在HTTP Response显示声明:Content-Type为:vnd.wap.xhtml+xml,那么TC将不对这个页面转码,而是直接跳转至相应的自有WAP页面。