友情链接平台须知投稿
友情链接查询:
登录注册

当前位置:首页 > 站长资讯 > 搜索引擎原理知识大全

搜索引擎原理知识大全

2017-07-24 14:27:24  来源:速链吧  浏览:

搜索引擎原理知识大全

  搜索引擎原理是什么

  首先在互联网中发现、搜集网页信息;同时对信息进行提取和组织建立索引库;再由检索器根据用户输入的查询关键字,在索引库中快速检出文档,进行文档与查询的相关度评价,对将要输出的结果进行排序,并将查询结果返回给用户。

  举个例子:小王想买个iphone 7装逼,就查一下价格。它在百度的搜索框里输入了“iphone 7售价”,点击搜索按钮。这里小王的关键词“iphone 7售价”就是他的信息需求。百度在展示出搜索结果的那零点几秒之间,它的程序在巨大的数据库里按照关键字进行了查找,终于计算出所有关于iphone 7价格的网页。

  搜索引擎工作原理流程

  可以看做三步:从互联网上抓取网页→建立索引数据库→在索引数据库中搜索排序。  

  首先,从互联网上抓取网页

  利用能够从互联网上自动收集网页的Spider系统程序,自动访问互联网,并沿着任何网页中的所有URL爬到其它网页,重复这过程,并把爬过的所有网页收集回来。

  然后,建立索引数据库

  由分析索引系统程序对收集回来的网页进行分析,提取相关网页信息(包括网页所在URL、编码类型、页面内容包含的关键词、关键词位置、生成时间、大小、与其它网页的链接关系等),根据一定的相关度算法进行大量复杂计算,得到每一个网页针对页面内容中及超链中每一个关键词的相关度(或重要性),然后用这些相关信息建立网页索引数据库。

  最后,在索引数据库中搜索排序

  当用户输入关键词搜索后,由搜索系统程序从网页索引数据库中找到符合该关键词的所有相关网页。因为所有相关网页针对该关键词的相关度早已算好,所以只需按照现成的相关度数值排序,相关度越高,排名越靠前。最后,由页面生成系统将搜索结果的链接地址和页面内容摘要等内容组织起来返回给用户。

  百度的强大,不只是搜索技术,还来自于两大块,一是内容护城河,二是入口把控。前者是百度贴吧,百度mp3,百度知道,百度百科,百度文库;后者是hao123导航和百度联盟。google进中国的时候,在这两块都有动作,投资天涯,收购265,以及大力发展google联盟。

  一个好的搜索引擎,不仅数据库容量要大,更新频率、检索速度要快,支持对多语言的搜索,而且随着数据库容量的不断膨胀,还要能从庞大的资料库中精确地找到正确的资料。

本文由速链吧友情链接平台为您整理发布,若涉及版权问题,请原作者联系我们处理!