作业帮 > 综合 > 作业

搜索引擎是什么意思?

来源:学生作业帮 编辑:拍题作业网作业帮 分类:综合作业 时间:2024/04/28 10:58:16
搜索引擎是什么意思?
从使用者的角度看,搜索引擎提供一个包含搜索框的页面,在搜索框输入词语,通过浏览器提交给搜索引擎后,搜索引擎就会返回跟用户输入的内容相关的信息列表.\x0d  互联网发展早期,以雅虎为代表的网站分类目录查询非常流行.网站分类目录由人工整理维护,精选互联网上的优秀网站,并简要描述,分类放置到不同目录下.用户查询时,通过一层层的点击来查找自己想找的网站.也有人把这种基于目录的检索服务网站称为搜索引擎,但从严格意义上讲,它并不是搜索引擎.\x0d【分类】  1、全文索引\x0d  全文搜索引擎是名副其实的搜索引擎,国外代表有Google,国内则有著名的百度搜索.它们从互联网提取各个网站的信息(以网页文字为主),建立起数据库,并能检索与用户查询条件相匹配的记录,按一定的排列顺序返回结果.\x0d  根据搜索结果来源的不同,全文搜索引擎可分为两类,一类拥有自己的检索程序(Indexer),俗称“蜘蛛”(Spider)程序或“机器人”(Robot)程序,能自建网页数据库,搜索结果直接从自身的数据库中调用,上面提到的Google和百度就属于此类;另一类则是租用其他搜索引擎的数据库,并按自定的格式排列搜索结果,如Lycos搜索引擎.\x0d  2、目录索引\x0d  目录索引虽然有搜索功能,但严格意义上不能称为真正的搜索引擎,只是按目录分类的网站链接列表而已.用户完全可以按照分类目录找到所需要的信息,不依靠关键词(Keywords)进行查询.目录索引中最具代表性的莫过于大名鼎鼎的Yahoo、新浪分类目录搜索.\x0d  3、元搜索引擎\x0d  元搜索引擎(META Search Engine)接受用户查询请求后,同时在多个搜索引擎上搜索,并将结果返回给用户.著名的元搜索引擎有InfoSpace、Dogpile、Vivisimo等,中文元搜索引擎中具代表性的是搜星搜索引擎.在搜索结果排列方面,有的直接按来源排列搜索结果,如Dogpile;有的则按自定的规则将结果重新排列组合,如Vivisimo.\x0d  其他非主流搜索引擎形式:\x0d  1、集合式搜索引擎:该搜索引擎类似元搜索引擎,区别在于它并非同时调用多个搜索引擎进行搜索,而是由用户从提供的若干搜索引擎中选择,如HotBot在2002年底推出的搜索引擎.\x0d  2、门户搜索引擎:AOL Search、MSN Search等虽然提供搜索服务,但自身既没有分类目录也没有网页数据库,其搜索结果完全来自其他搜索引擎.\x0d  3、免费链接列表(Free For All Links简称FFA):一般只简单地滚动链接条目,少部分有简单的分类目录,不过规模要比Yahoo!等目录索引小很多.\x0d【工作原理】\x0d  1、抓取网页\x0d  每个独立的搜索引擎都有自己的网页抓取程序(spider).Spider顺着网页中的超链接,连续地抓取网页.被抓取的网页被称之为网页快照.由于互联网中超链接的应用很普遍,理论上,从一定范围的网页出发,就能搜集到绝大多数的网页.\x0d  2、处理网页\x0d  搜索引擎抓到网页后,还要做大量的预处理工作,才能提供检索服务.其中,最重要的就是提取关键词,建立索引文件.其他还包括去除重复网页、分析超链接、计算网页的重要度.