。
据Google所述,当前Googlebot正对一小部分高质量网站进行表格提交的尝试。这意味着Googlebot 此刻已经知道经过过程提交表格而获得新内容。此外,当前Googlebot只提交GET类型的表格。既不会对网站的PR值造成影响,也不会对网站的正常抓取、排名等造成影响。
此刻Google初步供给提交表单(form)创造后来的网页。 Google当然已经是抓取页面最多的搜索引擎,但还是不满足,由于有很多网页和信息是很难被创造和抓取的。 Matt Cutts也写了个帖子举例申明这么做的好处。为了进一步抓取互联网的内容,Google发布揭晓Googlebot已可经过过程提交表格抓取更多内容。比方当表格需要输入用户小我信息比方密码、用户名、接洽人等,Googlebot是 会主动略过这些表格的。 这类表格抓取当前只是一个小规模的尝试,Google暗示不会对网站造成影响。提交表格后一旦 Googlebot感触闪现的新内容是正当而且是乏味及奇怪的,它便可能会把内容抓取进Google的搜索功效索引数据库里。有很多网站首页只是以表单编制列出公司属下的各地分辨站,没有以链接情势列出各分站。 这当然给一些网站的收录创作创造了机缘,是不是也会对某些公司网站带来必定的安然风险?网站某部分不想被收录的话,赶快用robots.txt文件防止吧。 同时Google也强调,若是网站的robots.txt文件里防止了对表格进行了潜匿,不但愿表格提交后所产生的链接被抓取,那Googlebot 是不会抓取的。 之前我们已经知道Googlebot除了能抓取文本、视频、音频、Flash等类型的内容外,它还可以经过过程JS代码抓取链接。当Googlebot创造这些网站上有HTML表格时(即检测到时),它就会主动从网站上选择一些词语输入表格的文本框里,而后再选择分歧的按钮、勾选项及验证项,再提交表格。这类网站之前是不能被深度收录的,由于Google不提交表单,就创造不了潜匿在表单后面的URL。这也就是为甚么做网站时必定要正视搜索引擎和睦。
信息网址:http://www.khcha.com/ziyuan/view10445.htm