Memail首页 订阅杂志 广告合作 联系我们
 

Googlebot开始检索网站深层内容


2008年04月14日 21:24  驱动之家


  Google公司今天宣布,其Googlebot web信息采集系统将开始自动填写HTML表单,并记录反馈结果。

  Google搜索引擎似乎在不顾一切的吞食来自互联网的数据,仅去年1年它就吞下了约100 Exabytes(1 Exabyte=1000000000 Gigabyte)的数据。之前Google并不触及大量的深层页面(也就是网站中被隐藏的内容,例如没有连接的页面,非文本的内容,或是动态内容返回的结果),但是从今天开始,Google将开始对这些页面进行检索。

  据Google表示"对于文本框,我们的电脑会自动对网站上的表格进行填写,并会选择菜单,复选框,以及相应的按钮,然后索引有价值的HTML结果。"Google指出,对于动态表格所反馈的结果并不影响对网站的普通检索,排名或是其他的内容。并且Googlebot绝对会遵守robots.txt的规定不对禁止访问机器人访问的页面进行检索。

  据估计,目前互联网上的深层页面要比目前公布的页面大几个数量级。而且有人指出,Google永远也不能把互联网上的所有内容都检索到,其Googlebot的爬行结果对于整个互联网来说只是管中窥豹。不过Google表示,对深层页面的索引只是为了找出更多动态页面之间的联系,而不仅仅是为了索引结果。

推荐】【打印】【  】【关闭窗口

投资快讯: 休闲空间:
 如何少花“冤枉钱”?自助游省钱六  (04-12)
 寻仙记:如幻的幽谷 真实的行走  (04-12)
 航空公司的星级评选  (04-12)
 苏州之恋:爱情不能承受之温柔  (04-10)
 20个小妙招让性爱也环保起来  (04-10)
影视速弟: 音乐天堂:
 《鹿鼎记》修改700处5月山东首播  (04-12)
 《我爱你》对白镜头过于露骨陷入危  (04-12)
 《大奥》:日本版《金枝欲孽》  (04-12)
 《鹰眼》剧照首曝光拉博夫莫娜汉误  (04-12)
 《爱之城》系列锁定纽约拉博夫姜文  (04-12)
 周渝民“另有新欢”与林依晨7年后再  (04-12)
 奥运火炬传递歌曲确定《世界跟着我  (04-12)
 谢霆锋一夫当关为妻儿护航同返爱巢  (04-12)
 《郝云北京》,北京生活一碟游  (04-12)
 陈浩民马梓涵湖南宣传新专辑录制节  (04-12)
软件快报: 硬件资讯:
 赛门铁克安全报告:微软补丁最快红  (04-14)
 微软:VistaUAC就是故意找茬的  (04-14)
 Linux下的18个Windows应用代用品  (04-14)
 VistaSP1不支持Vista/Linux双启动  (04-14)
 新手必看的PP点点通12条下载使用秘  (04-14)
 史上最贵NVIDIA芯片组曝光(图)  (04-13)
 高端化、个性化一季度硬件市场分析  (04-12)
 精挑细选!买机箱必须注意的细节分  (04-12)
 微软发布五款魔幻绚丽的无线鼠标  (04-12)
 中国3G太慢了!主流WiFi智能手机荐  (04-12)
想成为高手,靠自己摸索可远远不够。这里有众多的高手,愿把他们的经验与你交流。
发行周期:周一
发行记录:查看全部记录
 订阅更多的杂志
推荐:图片搜索

搜索16亿张互联网图片






·Intel开源显卡驱动2.2.99.903发布
·高危漏洞威胁系统安全微软狂打10补丁
·谷歌输入法新鲜玩法让你的眼睛更轻松
·优化大师给系统打兴奋剂让Vista狂飙
·唐骏:10亿元转会费是一次性付清原始股
·病毒播报:新一轮磁碟机/盗号变种袭来
·Intel卖掉企业存储光学资产
·利用网页可控制路由器默认口令是祸根
·盗窃问题出在病毒 网上银行安全不安全
·iPhone终于获得“无限”通话计划
CopyRight© 2003 Memail.net, All Rights Reserved. 网站地图 隐私声明