深入了解搜索引擎原理第二课

  上一节主要讲解了Google搜索引擎更新爬虫,和深度爬虫。

  更新爬虫:Google搜索引擎可以同时派出N个爬虫,同时访问互联网,如果发现新的信息就会放到自己所带的数据库中,我们把这种爬虫称之为“更新爬虫”。更新爬虫能够根据互联网上的URL地址,不停的以“光速”爬行,一旦自己所带的数据库装不下更多的信息时,它们会返回谷歌所提供的单独数据库,把自己所带的信息放在里面,然后又出来接着收集信息。

  深度爬虫:深度爬虫的主要任务是访问Google主索引中已经存在的网站,进行整体的服务器更新,目前Google深度爬虫几乎可以每天更新一次,所以如果不注意观察是根本察觉不到的。但是百度深度爬虫的时间就要长一点,大概是一周进行深度爬行一次,所以许多做百度的SEO,都盼望百度深度爬行,因为百度深度爬行,就意味着,自己上一周的工作将被百度肯定。

  今日重点

  这一节将讲解Google搜索引擎的具体工作流程,以及如何为我们提供搜索结果。

  第一步:Google服务器整理,Google每天派出大量更新爬虫,到互联网发现新的网站信息,然后带回Google服务器等待进行整理。

  第二步:Google服务器进行整理后,索引到Google主索引中去,将没有被索引的信息进行删除。

  第三步:Google服务器整理,每天放出Google深度爬虫,爬行主索引,对资料采用关键词排名算法进行计算,列出名次,数据库稳定。

  第四步:用户输入主关键词时,GG服务器,将用户输入转换为计算机看的懂的内容,并向主索引索取答案。注意:GG服务器向主索引索取的答案是由:GG主索引内容+更新爬虫内容 一起组成的。

  第五步:主索引将关键词列表转换成字符流,交给GG服务器,GG服务器,再将答案显示给用户。

  Google何时开始为您打分

  以上便是Google整个工作流程,对此工作流程比较有争议的是:Google何时开始给您的网站关于某个关键词打分。

  据笔者观察,Google是在爬行您的网站,收集网站信息时就开始记录您网站表现,关于网站的结构是否友好,网站链接相关度是否足够高,网页代码是否友好。等这些排名因素。等到Google服务器放出深度爬虫时,主索引根据排名算法进行排名时,更新爬虫会把自己的数据也递交给主索引,帮助排名算法进行工作。

  Google提供的搜索结果

  对于许多SEO来说,Google只有一种搜索结果--内容关键词结果。其实Google提供的关键词搜索结果还有一种特殊结果--图片,pdt文件等。笔者建议各位SEO适当的关注特殊搜索结果。

  要知道在未来,并不是单单内容搜索才能获得客户。

类别:网站推广(SEO)  来源:互联网  作者:hpping  日期:2010-11-19 09:20

上一条:谈谈互动式网络营销
下一条:细数百度推广关键词七宗罪,烧钱都是因为它!