第一部分: 最新消息! Google的主要变化
Google的主要变化始于2003年11月的16号,从那时候起,网上论坛就开始对此议论纷纷并产生了形形色色的推测。这种更新对一些人是坏消息,而对另外一些人却是好消息(不过大多数猜测都来自于那些认为这是坏消息的人).Google对其变化只字不提,当然我们也别指望它会说点什么。因此,这篇文章代表了我个人的部分推测,希望它至少为读者您提供了一些“较为可靠的推测”.
除了在对搜索结果的排名方式上有一些显着变化外,Google在搜索结果的格式上亦有一些根本的改变,在我看来,这些变化在极大程度上展示了Google的整体发展方向。
我首先会回顾Google最近的变化,然后提出我对Google新策略的一些探索,并对一些不好的传言进行澄清。最后为如何在“新”Google中取得成功献上我的个人建议,供大家参考。
1-1. 总观Google新变化
现在,Google确定无疑是在进行一些新的及与以往完全不同的改变,并使得如此多查询条件受到影响,使它们的搜索结果与以往完全不同。让我们在深入挖掘其“巨大变化”之前,先来看看并未引起人们太多关注的一些较小的变化(如下所示).于用户而言,这些小颁化加起来产生了许多新的特性
1-1-1.关键词词干法(Keyword Stemming)
Google的另外一个变化是开始采用词干法进行搜索服务。换言之,如果在搜索框中键入”dietary“,那么也会得到一些基于”diet“的搜索结果。关于这一点还是请大家看看Google的解释--”Google目前使用了词根还原技术“.也就是说,它不再拘泥搜索与输入查询完全相同的词语,亦会向用户提供与部分或所有查询词语相近的搜索结果。例如,对于查询词语”pet lemur dietary needs“,Google也会显示”pet lemur diet needs“及其它词性变化形式的搜索结果。而且对于搜索结果页上出现的查询词本身及其不同的变化形式,Google会以粗体突出表示。”
实际上词干法的介入已有一段时间了,只是在此之前我们没法确定它到底是属于玩票还是试验性质的,不过现在看来,Google已在其搜索技术中正式引入了词干法。
1-1-2. 信息第一位了吗
在“新”Google的搜索结果中,我们很多人注意到的第一件事情就是,即使用纯粹商业性质的词语进行查询时,位于页首的却往往并非一些相关的商业性站点,而是被大量含有“信息”和“资源”的性质的页面所占据。但我却并不认为它必然地说明了Google对商业站点存在着偏见。
我反而觉得,Google目前的搜索结果的变化揭示出一些原来排名很好的网站的“真实面目”,它们虽然赚取了较高的页面级别,但却只是徒有虚名,本身并没有提供什么有份量的网站内容。而且在过去,一个网站要想排名在前十位并非什么难事,只要对页面进行优化,获取足够的外部链接数量(不管这些链接是否具有同一主题甚至是否相关),然后您再瞧––排名效果立竿见影。
如果一个网站本身的内容就很少,而且相关的外部链接又少,并且所有外部链接都是通过链接交换而得到的,这种网站的排名在Google这次的更新中往往首当其冲受到显着的影响。Google的新算法似乎对那些含有大量实用内容的主题性站点极其有利,用户喜欢的也是这样的站点。
1-1-3. 随时调整排名算法
自从去年11月15号以来,Google始终在对排名算法进行调整,有很多原来排名大幅下降的网站现在不但恢复了排名,而且位置较以往有了显着的提升。我们可以期待,Google会坚持不懈地对算法进行调整和改变来提高搜索结果的质量。
1-2. Google的发展战略
倘若搜索引擎能够理解用户的查询本意,那么向用户提供高质量的搜索结果也并非难事。但是,当用户键入“DVD PLAYER”这几个字时,你知道他到底想要什么吗?是想买DVD播放机呢,还是想知道怎么把DVD和电视相联?是想看关于DVD播放软件方面的评论呢,还是要找能够在计算机上播放DVD的软件?
Google的发展战略与其它搜索门户网站不同,其目标是向不同类型的搜索用户提供不同的搜索服务类型。“新”Google的一个有趣之处是在其主要搜索结果中开始揉合使用其它搜索工具。
《搜索引擎观察》杂志的资深编辑丹尼-苏利文(Danny Sullivan)发明了一个叫“invisible tabs”的术语,用来描述搜索引擎可能会怎样来试图提供更贴近用户本意的搜索结果。
他认为:搜索引擎(例如Google)已然能够使用多种资源(象Google就提供了网页、目录、网上论坛、新闻、在线购物、图书搜索等多种服务形式),这些资源信息将被引入搜索引擎的主要搜索结果。
1-2-1. Google的商品购物搜索引擎Froogle
2002年12月,Google推出了商品购物搜索引擎Froogle测试版。用户登陆froogle.google.com后即可在网上找到想购物的网站,然后可以比较世界各地同类产品的价格。
此外,在用户进行普通查询时,若查询术语与商业相关,则Google将从Froogle获得相关商品信息,并将其展现在普通搜索结果的顶端。
对网上购物站点来说,Froogle实在是个不错的选择。不但免费收录你的网站,提交步骤亦相当简单。
1-2-2. Google的目录搜索服务
Google Directory依据的是网上最大的人工编辑网络目录DMOZ,再结合Google的“网页级别”技术,让网页根据重要性来排列,并通过网页列表前的绿色横线长度来标明网页的重要程度。
在Google提供的普通搜索结果中,若一个网页已被DMOZ收录,则Google会列出该网页在DMOZ中的描述及相应的目录信息。此外,在普通搜索结果页的最上方位置,大家也可以看到与查询条件相符合的目录链接。
Google的目录搜索服务可满足那些想要浏览某特定主题下相关信息的用户。如果你的网站还未被DMOZ收录,那就赶紧行动吧。
如果你还在质疑目录列表对网站的重要性,我建议你去读一读Google搜索小贴士上的最后一段:
“当无法确定查询条件时,我们推荐用户使用Google网页目录。它可有效限定搜索范围,不会向用户显示其它类似但无关的网页。例如,若在”天文学“目录下查找”土星“,则返回关于土星的信息。而在汽车目录下搜索”土星“时,则返回通用公司”土星车“方面的信息资讯。当搜索范围涵盖太广时,使用目录服务可有效缩小搜索范围。”
Google欲自用户处了解他们想在目录下查找什么样的信息。等我讲到“主题性页面级别”的时候,你就可以明白,Google是怎样来提供与目录主题匹配的搜索结果的。
1-2-3. Google的新闻搜索服务
Google新闻保留了三十天内所发生的较有价值的报道和头条新闻,用户可使用其新闻搜索系统查找当前事件的新闻。新闻报道依照发布日期,相关报道数量和新闻来源的受欢迎程度进行排序。
在一般性搜索中,我们可以看到搜索结果页顶端的部分新闻搜索结果,当用户进行一般性查询时亦可看到相关的新闻内容。
目前尚为测试版的Google News与其它搜索服务稍有不同,其新闻来源并不仅限于象“纽约时报”这样的大型传媒。目前Google新闻搜索服务已有4,500家传媒来源。尽管其它大型ICP网站也提供了重要新闻网站的链接,但在涵盖面和消息来源上往往不如Google.
1-2-4 Google的图书检索服务
继亚马逊网站之后,Google也推出了其测试版图书搜索服务Google Print.用户可找到图书的简要节选,评论及作者简介等,甚至可能找到图书的外观照片。搜索结果中还提供了在哪里可以买到这本书的相关链接以及Google的相关广告。Google一直都在探索如何进一步提高搜索服务的水平,这次推出的图书搜索服务的测试正是该公司不断改进搜索服务努力的一部分。目前该项服务所提供的印刷图书数量仍十分有限,不过Google这个搜索巨人是不会让我们失望的,让我们拭目以待吧。
1-2-5. Google会推出更多搜索服务吗?
Google不断地推出新的搜索服务,其目的无外为用户提供更好的搜索体验。这不但对用户来说是个好消息,因为他们可以更加便捷地找到自己所需的信息,而且对网站也是好事情。可能不久以后网站就只需针对目标群体来有的放矢,而无须在日益庞大的搜索结果中喊破嗓子来招揽生意了。
第二部分: 探索Google PageRank新算法
2-1. Google的主题性趋向
2-1-1. 关于页面级别(PageRank)及Google的旧算法出现问题的原因
页面级别(PageRank)计算系统所遵循的思路是:通过一个经由互联网的“随机运动”来告诉你哪些站点是最重要的。该系统模拟的是一个随机冲浪者跟进点击某页面上的随机链接,至最深层页面时按“返回”按钮这一过程。页面的等级越高,则随机网络冲浪者发现它的机率亦越高。
这种思路其实相当富有创意。一个网页的外部链接越多,则对任意网络冲浪者来说,发现它的机会也就越大。同时,在页面级别算法系统中,页面越流行,则其导入链接就越能从链接中受益-这是由于任意网络冲浪者发现这些链接的机会就越大。
在特定领域的研究论文查询方面,页面级别系统几乎无可挑剔。例如,如果用户查询关于素粒子物理学研究方面的论文(或网页)文献集,则对于一个给定条件的查询,页面级别的算法可以很快告诉你,哪些论文才是与该特定查询条件最相关及最重要的论文,其原因就在于这些论文较其它论文的引用次数要多。
若互联网上的资源具有同一主题性,那么这种工作可说是尽善尽美了。但正如我们所知道的,互联网上的资源涵盖了上百万甚至更多的主题,而且在人们的实际生活中,查询用户所寻找的往往是一些具有特定主题的信息。所以虽然页面级别系统考虑了所有链接,但却忽视了链接页面的主题性。
Google已试图将链接的文本内容计入排名算法
信息网址:http://www.khcha.com/ziyuan/view10940.htm