用link rel="canonical"来避免搜索引擎抓取重复内容

网站一般都可以通过www.lianglong.org或者lianglong.org访问,但是两个页面的内容都是一样。再比如,对于使用静态化的discuz论坛,可以通过http://www.somesite.com/bbs/viewthread.php?tid=***或者http://www.somesite.com/bbs/thread-***-1-1.html这样的方式访问,但是内容是完全一样的。对于普通用户而言没有问题,但是对于搜索引擎而言,他们会抓取两个不同URL,但是内容是一样的。

这样会带来什么问题呢?它会导致你的内链或者外链降低或者失去应有的效果。这就好比自来水管,分流多了,每个分支的水量就小,因此如果只有一个canonical(权威)版本的内容,所有链接都指向这里,就会提升这个链接的权重。

解决这类问题一般使用301重定向,但是有时候301重定向操作起来比较难,有的服务器不支持.htaccess编辑,那就没法做301重定向。搜索引擎委员会由Google, Yahoo and MSN等一起推出了link rel="canonical"标记,用于解决重复内容问题。<link rel="canonical" href="http://www.somesite.com" />这段代码要放到<head>标记代码中,这样就无需301重定向操作了。

再举个例子:
比如下面2个链接都指向到一篇相同内容的新闻文章
http://www.somesite.com/news/100
http://www.somesite.com/news.php?id=100

为了避免搜索引擎认为是"重复内容的网页",只要我在网页的<head>中加入<link rel="canonical" href="http://www.somesite.com/news/100" /> 标签属性问题就解决了。PageRank和相关的其他因素,也都会自动指向该标准URL。这个标准同时也被其他搜索引擎在抓取和索引您网站时所接受和使用。
 

时间:2010-11-26 | 分类:技术文摘 | 标签:
评论列表
64x64
中医网 2011-08-03 17:00:06 回复
我设置了301冲定性,还用设置这个吗?
64x64
五笔打字练习 2010-12-19 01:54:40 回复
请问是每个页面都有加吗
64x64
haha 2010-12-02 05:40:53 回复
不错哈哈<img src="/image/face/5.gif" />
发表评论
昵称
邮箱
内容