提高网站在Google中的排名—面向搜索引擎的网站设计
客户查询网整理 发布日期:2014/9/28 0:00:00

  内容摘要:

  目前中文网站在整个互联网中的影响还比较小,这主要是由于中文网站总体的水平(技术上,内容上)都还相对落后造成的,最主要的表现有:

  行业知识:不知道搜索引擎对吸引的新用户的重要性,在搜索引擎排名服务中追求“傻瓜相关”,购买一些其实没有太多实际意义的行业关键词。其实能够用户输入的关键词越多,真对性越强,价值越高。如果用户能够直接定位到产品具体内容页比到网站首页有价值的多;

  发布技术:网站的网页进入Google的索引量非常小,动态网页仍是主要发布机制,缺乏将动态页面链接表现成静态页面的机制;

  页面设计:页面标题重复,关键词不突出,过渡使用JavaScript脚本/图片/Flash等不适合搜索引擎索引的非文本形式;

  无法量化的东西是不可管理的,以上根本的原因往往是网站自身缺乏日志统计分析造成:

  其实大部分网站只要通过一些简单的策略还是可以让网站自身的水平在互联网中有一个真实的体现,网站结构设计中面向搜索引擎的优化注意事项包括:

  链接引用的重要性;

  如何突出关键词:网页标题、主题的设计;

  页面及站点结构设计注意事项;

  以及站点访问统计的重要性等;

  Google的站点设计指南

  (注意:本网站设计本身就利用了其中一些方法)。

  什么是PageRank

  搜索引擎的宗旨在于提取互联网中质量最好的内容提供给用户,任何有利于帮助用户获得优质内容的策略都是搜索引擎研究目标。什么是互联网中最好的内容呢?首先:互联网大约是8G个网页,而且以每天2M的速度增长的。其中80%以上是动态网页,而占总量20%的静态网页就是一个相对比较简单的过滤规则。其次:用户友好(User friendly)也是很重要的方面,搜索引擎利用算法帮助提升这些优质网站,包括:通过CSS将内容和表现分离:关键词密度计算,标题明确:无标题,重复标题或者标题SPAM(类似于:游戏游戏游戏游戏游戏游戏这样的标题)进行过滤或降低得分页面大小:因为页面过大会导致用户下载缓慢;链接引用:不仅需要有链接链入,也需要帮助用户找到其他更有价值的内容;文件类型:PDF和DOC等专业文档和来自edu,gov等非赢利网站的内容;链入网站的文字:所有用户不可见的因素全部被忽略。用户搜索的行为本身也被Google记录,可能对目标网站的主题相关度有帮助。 Google等新一带搜索引擎的优势之一在于不仅索引量很大,而且还将最好的结果排在搜索结果的最前面,具体的原理可以参考Google の秘密 - PageRank 徹底解説一文,PageRank简单的说类似于科技论文中的引用机制:谁的论文被引用次数多,谁就是权威。在互联网上PageRank就是基于网页中相互链接关系的分析得出的。

  此外,从计算方法角度阐述PageRank机制还有这篇文章:里面有更详细的PageRank算法说明和各种清晰的小型个案分析:

  比如:子页中导航条的重要性

  B <=> A => C

  Vs

  B <=> A <=> C (好)

  页面数量因素:

  B <=> A <=> C

  Vs

  F <= /=> G

  B <=> A <=> C (好)

  D <=/ => E

  一个意想不到的结论:

  (B <=> A <=> C) ( E <=> D <=> F)

  Vs

  (B <=> A <=> C) <=> ( E <=> D <=> F)

  PageRank升高的只是被链接的2个首页A和D,而网站子页面的PageRank平均会略有下降。同时:一个网站进入Google的索引量越大其受类似因素影响越小。

  PageRank不对称的页面互链:

  Google会用BadRank之类的算法进行纠正,而且一个网页着有来自“与其自身不相称”的高PageRank站点的链接,而自身又缺少足够数量和质量的反相链接的话,其PageRank会自动降低为0,A(pr=7) <=> B(pr=0)

  简单的说就是:偶尔要被权威站点反相链接不算数,要被足够多的权威站点引用才能提高自身网页的PageRank。

  Web超链分析算法综述(南京大学论文) 更多论文可以通过搜索:“filetype:pdf google pagerank anchor text bayesian”得到

  链接就是一切

  在互联网的海洋中,最重要的就是互联互通,不被其他网站引用的网站就是“信息孤岛”。“酒好也怕巷子深”,也许这话说起来有点像垃圾邮件广告,但事实就是这样。所以如果做网站的目的不是孤芳自赏,就需要积极的推广自己的网站。

  通过搜索引擎推广自己需要注意以下几个方面:

  以量取胜:不一定加入大型网站的分类目录才是网站推广,来自其他网站的任何反相链接都是有用的

  网站推广比较经典的方式就是加入比较大型门户网站的分类目录,比如:Yahoo!,dmoz.org等。其实这里有一个误区:不一定非要加入大型网站的分类目录才是网站推广,因为现在搜索引擎已经不再只是网站目录的索引,而是更全面的网页索引,所以无论来自其他网站任何地方的反相链接都是非常有价值的,哪怕是出现在新闻报道,论坛,邮件列表归档中。Blogger(Weblog的简称)们也许最深刻地理解了“链接就是一切”这句话的含义,由于Blog的内容之间有大量的相互链接,因此最经常被引用的 Blog页面在搜索引擎中的排名往往比一些大型商业网站的页面还要高。而wiki这样的文档管理系统更加突出了良好引用的特征。

  以质取胜:被PageRank高的网站引用能更快地提高PageRank

  数量只是关键因素之一,来自PageRank高的页面的链接还能更快的提高被链接目标的PageRank,我只是将一些文章投稿在了ZDNet中国上,由于页面上有文章出处链接,相应网页和网站整体的PageRank过了一段时间后就有了很大的提升。有时候被什么样的网站引用有时候比引用次数多更重要。这里我要特别感谢的是,当时ZDNet中国是唯一遵循了我的版权声明的要求表明了文章出处,并且有反相链接的网站。

  按照这个原则:能够名列Yahoo!和DMOZ这样的大型权威目录的头2层是非常有价值的。

  了解搜索引擎的"价值观":

  Lucene简介这篇文章被Jakarta.apache.org的lucene项目引用以后,这篇文章就成为了所有页面中PageRank最高的页面,而Google支持的一些项目,比如:Folding@Home,让我一直怀疑他们对政府,教育和非盈利组织的站点有特别加分,毕竟.org .edu才代表了互联网的实质:分权和共享。


  
信息网址:http://www.khcha.com/ziyuan/view10993.htm
相关信息