首页>学校动态>搜索引擎组成结构有哪些

搜索引擎组成结构有哪些

来源:郑州百知教育时间:2022/2/18 17:31:12

  随着互联网的不断发展,越来越多的用户都习惯通过互联网来获取信息,而这些信息的获取都离不开搜索引擎的辅助,先我们就通过案例分析来了解一下,搜索引擎组成结构都有哪些。

  在信息量增长的情况下,如何能够找到满足用户需求的网页内容就日益成为越来越重要的问题。信息增长速度越快,用户需求越迫切,相应的搜索结果就越要准确。大的搜索引擎公司就是在这个用户需求背景下,从建立到逐步壮大,乃至发展到今天搜索引擎成为重要的互联网的应用。

  搜索引擎的信息源自于互联网的网页,通过网络爬虫将整个互联网的信息获取到本地,因为互联网页面中有相当大比例的内容是完全相同或者近似重复的,“网页去重”模块会对此做出检测,并去除重复内容。

  在此之后,搜索引擎会对网页进行解析,抽取出网页主题内容,以及页面中包含的指向其他页面的链接。为了加快响应用户查询的速度,网页内容通过“倒排索引”这种查询数据结构来保存,而网页之间的链接关系也会予以保存。之所以要保存链接关系,是因为这种关系在网页相关性排序阶段是可利用的,通过“链接分析”可以判断页面的相对重要性,对于为用户提供准确的搜索结果帮助很大。

  当搜索引擎接收到用户的查询词后,先需要对查询词进行分析,希望能够结合查询词和用户信息来正确推到用户的真正搜索意图。在此之后,先在缓存中查找,搜索引擎的缓存系统存储了不同的查询意图对应的搜索结果,如果能够在缓存系统找到满足用户需求的信息,则可以直接将搜索结果返回给用户,这样既省掉了重复计算对资源的消耗,又加快了响应速度;如果保存在缓存的信息无法满足用户需求,搜索引擎需要调用“网页排序”模块功能,根据用户的查询实时计算哪些网页是满足用户信息需求的,并排序输出作为搜索结果。而网页排序重要的两个参考因素中,一个是内容相似性因素,即哪些网页是和用户查询密切相关的;另外一个是网页重要性因素,即哪些网页是质量较好或相对重要的,这点往往可以从链接分析的结果获得。结合以上两个考虑因素,就可以对网页进行排序,作为用户查询的搜索结果。

上一页 下一页

推荐课程更多>

申请体验课

关于我们 | 联系我们 | 郑州百知教育

版权所有:培训指南

  • 在线咨询
  • 电话咨询
  • 预约试听