最近有个客户被一个Goolge的问题所困扰:在Google内输入搜索一个特定的关键字,他的网页显示在搜索结果的第一页,这本来是一件好事,但是Google显示的摘要信息是网页数月前的内容。对于很多人来说,这也并非是一件太不好的事情,因为访问者可以点击链接查看新的网页,但要命的是,Google显示的摘要信息中有他已经更换掉的电话号码,这个电话号码现在正被其竞争对手在使用,于是,他求助于我,是否可以将Google显示的摘要信息立即更新为新网页的内容?
我知道Google是不停地在网络上爬行,抓取新的页面到它的数据库中,同时,它也会更新数据库中的老资料。这样,新页面被抓取到它的数据库或更新数据库中的网页是需要一段时间的,一般人也不会去追究这个时间的长度,而这个客户提出的疑问,确实是我第一次碰到。于是,我到了Google网站上,希望能看到这样的帮助信息。
进入“Google大全”,我便找到了答案。关于如何删除网站的记录,Google告诉我们有以下几种情况:
1. 更改网址
由于 Google 漫游器依网址来辨别网页,所以您不能自己更改目录里的网址。Google 下次漫游时都会自动更新这些网址。漫游器的行程是自动设定的,没有办法让它提前到达您的网站。
如果您在 Google 漫游后更改了网址,您可以填写网页登录申请表,并按照下列说明删除旧网址。但还是要提醒您,登录的新网址不会马上生效,所以在 Google 下次漫游前的那段时间里,可能无法通过 Google 访问您的网站。
建议您要求各网站更新当前指向您的旧网站的链接,使其指向您的新网站,而不要申请更改网址。另外,请不要忘记更改您在 Yahoo! 目录和其它网页目录中的记录。最后,如果您的旧网址使用 HTTP 301(永久)重定向指向您的新网站,Google 漫游时会自动获知新网址,并在六到八周内自动进行更新。
2. 删除整个网站
要从 Google 目录中删除整个网站或部份网页的记录,可以在您服务器的根目录中放置一个 robots.txt 文件。
如果您不希望 Google 漫游器或其它搜索引擎进入您的网站,请在服务器的根目录中放入一个 robots.txt 文件,其内容如下:
User-Agent: *
Disallow: /
这是大部份网络漫游器都会遵守的标准协议,加入这些协议后,它们将不会再漫游您的网络服务器或目录。有关 robots.txt 文件的详细信息,请访问:http://www.robotstxt.org/wc/norobots.html。
请注意:如果您的情况非常紧急,不能等到 Google 下次漫游您的网站时再进行删除,请使用我们的自动网址删除程序。您的网站管理员必须先创建一个 robots.txt 文件并将其放在您的网站中,这个自动程序才能工作。
只要您网络服务器的根目录中有这个 robots.txt 文件,Google 漫游器就不会进入您的网站。如果您无权访问服务器的根目录,也可以将 robots.txt 文件放在要拒绝漫游器进入的目录中。如果这样做或使用自动删除程序,Google 会暂时(90 天)从 Google目录中删除您的网站记录。(如果 robots.txt 文件不在根目录中,需要每隔 90 天再通过网址删除程序登记一次。)
3. 删除个别网页
如果只需要保护个别网页,可在那一页加入以下 HTML 代码:
<META NAME="ROBOTS" CONTENT="NOINDEX, NOFOLLOW">
如果您不介意其它漫游器,而单单不喜欢 Google,请加入以下代码:
<META NAME="GOOGLEBOT" CONTENT="NOINDEX, NOFOLLOW">
有关这个标准 meta 标签的详细信息,请访问:http://www.robotstxt.org/wc/exclusion.html#meta。
请注意:如果您的情况非常紧急,不能等到 Google 下次漫游您的网站时再进行删除,请使用我们的自动网址删除程序。您必须先在网页的 HTML 代码中插入适当的 meta 标签,这个自动程序才能工作。
4. 删除网页摘要
网页摘要是结果页上的文字摘要,其中所有关键词均以粗体显示。选择网页之前,可以通过这些摘要浏览一下搜索词在网页中的上下文。大部份人都会先选择有合适网页摘要的网页。
如果您不希望 Google 提供您网页的摘要,请在网页中加入以下代码:
<META NAME="GOOGLEBOT" CONTENT="NOSNIPPET">
请注意:删除网页摘要的同时也会删除网页快照。如果您的情况非常紧急,不能等到 Google 下次漫游您的网站时再进行删除,请使用我们的自动网址删除程序。您必须先在网页的 HTML 代码中插入适当的 meta 标签,这个自动程序才能工作。
5. 删除网页快照
Google 在网络上漫游时会保存大量文档中的文字。如果因保存网页的网络服务器出现临时故障而无法访问原始网页,最终用户还可以查看这些网页“快照”。这些网页快照是 Google 上次漫游时网页的内容。当您查看网页快照时,其顶部标题将提醒您这是快照,而不是实际网页。
如果您不希望任何漫游器保存您网页的快照,请将 meta 标签 NOARCHIVE 放入网页 HTML 代码的 <HEAD> 部份,如下所示:<META NAME="ROBOTS" CONTENT="NOARCHIVE">
如果您不介意其它漫游器,而单单不喜欢 Google,请加入以下代码:
<META NAME="GOOGLEBOT" CONTENT="NOARCHIVE">
请注意:此标签只删除“网页快照”链接,Google 仍会记录该网页,并显示网页摘要。:如果您的情况非常紧急,不能等到 Google 下次漫游您的网站时再进行删除,请使用我们的自动网址删除程序。您必须先在网页的 HTML 代码中插入适当的 meta 标签,这个自动程序才能工作。
6. 删除失效链接
Google 会定期自动更新整个网页目录。在网上漫游时,Google 会自动查找新的网页,删除失效的链接,并更新旧的链接。对于已经过时的链接,Google 极有可能在下次漫游时将其删除。
请注意:如果您的情况非常紧急,不能等到 Google 下次漫游您的网站时再进行删除,请使用我们的自动网址删除程序。我们只会删除那些网上已经不存在的网页。
7. 删除 Google 图像目录中的图像
我们不会随便删除 Google 图像目录中的图片,除非网主亲自要求我们这样做。您可以请网站管理员在服务器的根目录中放入一个 robots.txt 文件。(如果不行,可以将其放到您的目录中。)
示例:如果您的网站上有 www.webseo.cn/images/dogs.jpg,但您不希望 Google 收录 dogs.jpg 这张图片,您可以增加 www.webseo.cn/robots.txt 文件,其内容如下:
User-Agent: Googlebot-Image
Disallow: /images/dogs.jpg
如果要删除网站里所有图片的记录,请将包含以下内容的 robots.txt 文件放入服务器根目录:
User-Agent: *
Disallow: /
这是大部份网络漫游器都会遵守的标准协议,加入这些协议后,它们将不会再漫游您的网络服务器或目录。有关 robots.txt 文件的详细信息,请访问:
http://www.robotstxt.org/wc/norobots.html。
请注意:如果您的情况非常紧急,不能等到 Google 下次漫游您的网站时再进行删除,请使用我们的自动网址删除程序。您的网站管理员必须先创建一个 robots.txt 文件并将其放在您的网站中,这个自动程序才能工作。
只要您网络服务器的根目录中有这个 robots.txt 文件,Google 漫游器就不会进入您的网站。如果您无权访问服务器的根目录,也可以将 robots.txt 文件放在要拒绝漫游器进入的目录中。如果这样做或使用自动删除程序,Google 会暂时(90 天)从 Google目录中删除您的网站记录。(如果 robots.txt 文件不在根目录中,需要每隔 90 天再通过网址删除程序登记一次。)
显然,我的客户碰到的是第4中情况,需要立即删除网页摘要。可以的是,我点击Google提供的“自动网址删除程序”的链接(http://services.google.com/urlconsole/controller),始终无法进入,于是只能作罢,只能等到 Google 下次漫游到这个网页时再更新了。
另外针对与关键词,可以用加粗(及 ) ,也可以用相对大一点的字体突出关键词。 这样,GOOGLE将会更加关注这个关键词。
<!--可能有用的文字介绍(关键字、网页内容描述)--> 雅虎的机器人会抓的
如果你的网址没有进行IP解析而只做域名转发,就只是一个网址,或者它搜你的网页时刚好打不开.
信息网址:http://www.khcha.com/ziyuan/view10959.htm