什么是搜索引擎 搜索引擎的工作原理

本文章由注册用户 知识杂谈 上传提供 评论 发布 纠错/删除 版权声明 0
摘要:在互联网时代,我们应该都用过搜索引擎查询过一些信息。说到搜索引擎,我们脑海里想到的无非就是百度、谷歌、搜狗等等。搜索引擎这个名字也许我们并不陌生,但至于什么是搜索引擎也许大家并不怎么了解。下面小编就来介绍搜索引擎的含义及搜索引擎的工作原理。

一、什么是搜索引擎

搜索引擎是指根据一定的策略、运用特定的计算机程序从互联网上采集信息,在对信息进行组织和处理后,为用户提供检索服务,将检索的相关信息展示给用户的系统。搜索引擎是工作于互联网上的一门检索技术,它指在提高人们获取搜集信息的速度,为人们提供更好的网络使用环境。从功能和原理上搜索引擎大致被分为全文搜索引擎、元搜索引擎、垂直搜索引擎和目录搜索引擎等四大类。

二、搜索引擎的工作原理

搜索引擎的工作原理是从互联网上抓取网页,建立索引数据库,在索引数据库中搜索排序。它的整个工作过程大体分为信息采集、信息分析、信息查询和用户接口四部分。信息采集是网络机器人扫描一定IP地址范围内的网站,通过链接遍历Web空间,来进行采集网页资料,为保证采集的资料最新,网络机器人还会回访已抓取过的网页;信息分析是通过分析程序,从采集的信息中提取索引项,用索引项表示文档并生成文档库的索引表,从而建立索引数据库;信息查询是指用户以关键词查找信息时,搜索引擎会根据用户的查询条件在索引库中快速检索文档,然后对检出的文档与查询条件的相关度进行评价,最后根据相关度对检索结果进行排序并输出。

三、搜索引擎的工作流程

1、爬行和抓取

搜索引擎派出一个能够在网上发现新网页并抓文件的程序,这个程序通常称之为蜘蛛(Spider)。搜索引擎从已知的数据库出发,就像正常用户的浏览器一样访问这些网页并抓取文件。搜索引擎通过这些爬虫去爬互联网上的外链,从这个网站爬到另一个网站,去跟踪网页中的链接,访问更多的网页,这个过程就叫爬行。这些新的网址会被存入数据库等待搜索。所以跟踪网页链接是搜索引擎蜘蛛(Spider)发现新网址的最基本的方法,所以反向链接成为搜索引擎优化的最基本因素之一。搜索引擎抓取的页面文件与用户浏览器得到的完全一样,抓取的文件存入数据库。

2、建立索引

蜘蛛抓取的页面文件分解、分析,并以巨大表格的形式存入数据库,这个过程即是索引(index)。在索引数据库中,网页文字内容,关键词出现的位置、字体、颜色、加粗、斜体等相关信息都有相应记录。

3、搜索词处理

用户在搜索引擎界面输入关键词,单击“搜索”按钮后,搜索引擎程序即对搜索词进行处理,如中文特有的分词处理,去除停止词,判断是否需要启动整合搜索,判断是否有拼写错误或错别字等情况。搜索词的处理必须十分快速。

4、排序

对搜索词处理后,搜索引擎程序便开始工作,从索引数据库中找出所有包含搜索词的网页,并且根据排名算法计算出哪些网页应该排在前面,然后按照一定格式返回到“搜索”页面。再好的搜索引擎也无法与人相比,这就是为什么网站要进行搜索引擎优化(SEO)。没有SEO的帮助,搜索引擎常常并不能正确的返回最相关、最权威、最有用的信息。

网站提醒和声明
本站为注册用户提供信息存储空间服务,非“MAIGOO编辑”、“MAIGOO榜单研究员”、“MAIGOO文章编辑员”上传提供的文章/文字均是注册用户自主发布上传,不代表本站观点,版权归原作者所有,如有侵权、虚假信息、错误信息或任何问题,请及时联系我们,我们将在第一时间删除或更正。 申请删除>> 纠错>> 投诉侵权>> 网页上相关信息的知识产权归网站方所有(包括但不限于文字、图片、图表、著作权、商标权、为用户提供的商业信息等),非经许可不得抄袭或使用。
提交说明: 快速提交发布>> 查看提交帮助>> 注册登录>>
您还未登录,依《网络安全法》相关要求,请您登录账户后再提交发布信息。点击登录>>如您还未注册,可点击注册>>,感谢您的理解及支持!
最新评论
暂无评论
相关推荐
爷青回是什么意思 爷青回和爷青结有什么区别
爷青回其实就是“爷的青春回来了”的缩写,一般是指那些知名的人、经典的动画、游戏、影视剧等重新回归或复出。爷青回最早是出现在lpl圈子里,然后...
搜索引擎和浏览器的区别 搜索引擎和数据库的区别
也许在很多人的意识里,搜索引擎就是浏览器,浏览器就是搜索引擎,其实这是不正确的想法。搜索引擎不是浏览器,它们之间有区别。浏览器是一个程序,通...
大山鸡丝是什么意思 大山鸡丝的来源
在这个网络信息化时代,每天的网上冲浪选手人数众多,每隔一段时间就会衍生出一批新的网络流行词汇,如果你的“网速”不够快,可能就难以理解大家都在...
贫民窟女孩是什么意思 贫民窟姐妹是什么意思
都说女生们花钱多,真的不假,除了衣食住行之外,化妆品,护肤品各种都需要花钱。所以不少女生们用贫民窟女孩形容自己,消费不起过高的产品,只是表达...
搜索引擎的基本结构 搜索引擎的主要模块及功能
搜索引擎是将与用户检索内容相关的信息展示给用户的系统,是一项检索服务,是根据一定的策略,用特定的计算机程序,从网上搜集、整理信息并呈现给用户...