在Google搜索结果中除了列出网页的网页快照,类似网页以外,有时候Google还会把网页标志为补充材料。
到目前为止,Google并没有太多信息告诉大家补充材料是怎么定义的。在Google自己的网站管理员指南中所给的官方信息是这样写的:
补充网站是Google辅助索引的一部分。对辅助索引进行抓取的限制少于主要索引。例如,一个网址的参量可能使该网站无法被抓取到主要索引中,但仍可能被抓取到我们的补充索引里。
将网站包括其中的索引是完全自动的,没有任何方式可以选择或更改您网站的索引。请放心,包含网站的索引不会影响该网站的PageRank。
实际的情况是,被标为补充材料的网页在Google搜索结果中一般都会被排在普通网页的后面,所以通常是找不到的。除非关键词是比较长,并且比较具体的时候,补充材料才会出现。
(注:如医药招商在评论中所说,也有补充材料网页出现在前面,中文搜索结果里补充材料出现更多,不过与正常网页比,还是少数。)
被标为补充材料的网页是在单独的数据库(补充索引)里,不是主索引数据库,在补充索引里的网页被爬行的次数会减少,网页快照的日期也通常都是很旧的。
如果你的网站有很多网页被标为补充材料,在绝大部分情况下都不是什么好事。因为只有在普通结果不够的时候,被标为补充材料的网页才会出现在搜索结果中,自然对网页的排名有很大影响。
被标为补充材料的网页,通常有下面几种情况:
第一:有网址规范化问题。也就是带有www和没有www的两个网址版本都在数据库中,那么其中一个就有可能被标为补充材料。
第二:有时候已经被删除的网页,也就是实际上应该返回404错误的URL,会被列为补充材料。或者域名已经过期了,也有时会被标成补充材料。
第三:有时候站长在改动网页之后,新旧内容的两个版本的网页都会出现在Google索引中。而糟糕的是,其中一个会被标为补充材料。
第四:复制内容网页。很多转载或抄袭的内容会被标为补充材料。因为Google也没办法判断哪一个是原创的,所以有时候原创者也会遭殃。
第五:网页上相同或相似的内容太多。比如导航系统占网页内容比例比较大,而正文部分比较小。
从上面这几种情况来看,补充材料在大部分情况下和网页内容重复或类似有关。
如果你的网页被标志成补充材料,有什么办法解决呢?基本上没有什么太好的办法。你只能改正你所能控制的部分,比如说网址规范化问题,正文内容太少等。然后就等着Google解决他们自己的算法问题吧。
Google的补充材料问题是今年比较受关注的SEO问题。以前谈过哪些问题会造成补充材料,今天再谈一些更深入的观察。
补充材料指的是URL+日期+网页快照
补充材料不是针对文件,不是针对网页,而是针对特定的URL+日期+网页快照。
什么意思呢?
首先,补充材料是某一个特定的URL,而不是一个网页或者一个文件。比如说xxx.com和www.xxx.com,一般来说是同一个文件,但是是两个不同的URL。这两个URL有可能其中一个是正常网页,另外一个却是补充材料。
补充材料是针对特定的日期所抓取的网页快照,也就是说即使是相同的URL,在Google数据库中有可能存在多个版本,其中一个版本是日期A所抓取的新的内容,这个URL+这个特定的日期和网页快照,可能是在正常的数据库中。而另外一个日期B所抓取的内容(同一个URL,比较老的内容),却可能是在补充材料数据库中。
所以同样一个URL在Google数据库中有不同版本,不同日期,新的内容可能在主数据库,老的内容可能在补充材料中。
最近经常有这种情况,你搜索一个特定的句子,这个句子在网页中实际上已经不存在了,但是在以前的版本中曾经存在过。这个时候那个老的日期的版本的URL可能会被返回,同时标为补充材料。
补充材料对排名的影响
这个问题就比较复杂,要具体情况具体分析。
像前面讲的,同一个URL可能出现在不同的数据库中,新版本的URL可能会出现在正常的主要关键词的搜索中。但是在其他关键词搜索中,它也可能出现在补充材料中。
如果你的网站有很多补充材料,有可能影响排名。但是如果这些补充材料都有一个相应的新的URL+日期+网页快照版本,对排名的影响就不大。如果这些补充材料没有新的版本,影响就比较大。
补充材料URL会不会被更新
会被更新,但是被重新抓取的频率要比较低。
当Google蜘蛛来抓取这个URL的时候,如果以前使它成为补充材料的那个原因已经不存在了的话,这个URL可能就被重新归入主数据库。
补充材料会存在多长时间
一般来说补充材料会继续长期存在甚至长达一年或更长的时间。
不过出现补充材料并不是最大的问题,如果你的网站新版本已经都被重新抓取,就没关系了。
怎样避免出现补充材料
除了检查你的网站有没有造成补充材料的这些原因以外,链接可能会帮助很大。
信息网址:http://www.khcha.com/ziyuan/view10930.htm