也谈Google搜索引擎对原创内容的识别
客户查询网整理 发布日期:2014/7/23 0:00:00

  功效是,我的原始文章被搜索引擎赏罚了,至今在百度上找不到我的文章地址了,而Google前几蠢才从头索引了我这篇文章,其余时刻网站的排名都被上面那些主流门户网站抢走了。


   。凡是景象下,Google赐与门户网站的权值和网站权威度都很是高,当一篇完整不异的文章同时呈此刻门户网站和小我博客上的时辰,Google常常感触原创者是门户网站,除非小我博客的权值很是大。

  门户网站为了内容的大批更新而雇佣了很多“网站编辑”,“网站编辑”经过过程人肉遴选的编制从小我博客上遴选出精良的文章,并将这些文章复制到门户网站,复制内容的同时凡是会删除原始文章的作者和文章中的链接地址,同时小幅改削文章的问题问题,经过这一番“措置”,Google凡是很难剖断出到底哪个文章是原创,当一个原创小我博客的文章被大批门户网站复制往后,Google搜索引擎可能会赏罚这个原创博客,不再索引上面的文章。

  今朝的中国互联网仍然是主流门户网站的全国,小我博客的保存景象异常艰辛,小我辛辛苦苦的写作常常得不到回报,产生的内容却由于各类启事没法给小我带来应当获得的回报,所有的流量都逐步流向主流门户网站。

  这里我举一个例子,我在今年三月份曾经写了一篇文章《十个常常操作汇集密码的安然庇***子》,可是相当长的一段时刻里,我在Google中搜索这篇文章的问题问题时,却看不到来自我的博客的一点踪影,我看到的是甚么呢?这篇文章被21CN,中关村在线,新浪网,硅谷动力,计较机世界,瑞星科技等等无数大型门户或专业网站犯警转载,最具嘲讽意味的是,国家违法和不良信息举报核心这样的国家政府机关的网站竟然也犯警进行了转载,凡是景象下政府网站在搜索引擎中的权威度是很是高的。

  当然,小我博客也有本人的对策,就是请求门户网站删除复制的文章,但凡是会华侈重大的时刻和精力,当被复制的文章累计到不行胜数的时辰,完成这类工作量凡是是不成能的使命。

  是以,Google要想在中文的互联网景象下实现对于原创内容辨认的切确性,需要考虑操作专门针对中国不凡国情的不凡算法,否则,中国原创的博客群落将会慢慢被门户网站边沿化,走向自生自灭的可悲下场,最为可悲的是,中国最大的搜索引擎百度对于原创内容的辨认几近是一片空缺,这也使适当前中国的互联网的景象显得异常卑鄙。Google在分歧网站碰着不异内容的时辰,会基于很多分歧的按照来剖断事实哪个网站才是原创,而这样的剖断凡是是切确的。

  从内容上说,小我博客的内容远远没法和主流门户网站对照,主流门户网站存在本人的编辑团队和营销团队,存在足够的本钱和能力输出更好的内容,而小我博客要写一篇好文章需要酝酿很长时刻,每周能写一篇好文章已经算不错了,这就注定了小我博客是竞争不过门户网站的。

  Google中文网站打点员博客在《由抄袭酿成的几次再三内容》文章中提到:“分辨内容的原创来历是Google所擅长的,在大大都景象下原创内容源都能被切确地辨认出来,从而不会给发布真正原创内容的网站带来任何负面影响……当有人抄袭了您网站中的内容,并将其揭示在其他网站上取利。”

  遵守我的视察,Google辨认原创内容源的能力有时辰斗劲准,但有时辰不太准,禁绝的景象主若是在中文网站上,由于Google没法用简略的链接权重来平衡门户网站和小我博客之间的孰是孰非。
信息网址:http://www.khcha.com/ziyuan/view10456.htm

相关信息