搜索引擎的主要体系包括哪些
发布网友
发布时间:2022-05-01 01:23
我来回答
共1个回答
热心网友
时间:2022-06-21 20:59
搜索引擎(Search Engine)是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户的系统。搜索引擎包括全文索引、目录索引、元搜索引擎、垂直搜索引擎、集合式搜索引擎、门户搜索引擎与免费链接列表等。
全文索引
搜索引擎分类部分提到过全文搜索引擎从网站提取信息建立网页数据库的概念。搜索引擎的自动信息搜集功能分两种。一种是定期搜索,即每隔一段时间(比如Google一般是28天),
蜘蛛搜索引擎
搜索引擎主动派出“蜘蛛”程序,对一定IP地址范围内的互联网网站进行检索,一旦发现新的网站,它会自动提取网站的信息和网址加入自己的数据库。另一种是提交网站搜索,即网站拥有者主动向搜索引擎提交网址,它在一定时间内(2天到数月不等)定向向你的网站派出“蜘蛛”程序,扫描你的网站并将有关信息存入数据库,以备用户查询。随着搜索引擎索引规则发生很大变化,主动提交网址并不保证你的网站能进入搜索引擎数据库,最好的办法是多获得一些外部链接,让搜索引擎有更多机会找到你并自动将你的网站收录。
当用户以关键词查找信息时,搜索引擎会在数据库中进行搜寻,如果找到与用户要求内容相符的网站,便采用特殊的算法——通常根据网页中关键词的匹配程度、出现的位置、频次、链接质量——计算出各网页的相关度及排名等级,然后根据关联度高低,按顺序将这些网页链接返回给用户。这种引擎的特点是搜全率比较高。
目录索引
目录索引也称为:分类检索,是因特网上最早提供WWW资源查询的服务,主要通过搜集和整理因特网的资源,根据搜索到网页的内容,将其网址分配到相关分类主题目录的不同层次的类目之下,形成像图书馆目录一样的分类树形结构索引。目录索引无需输入任何文字,只要根据网站提供的主题分类目录,层层点击进入,便可查到所需的网络信息资源。
虽然有搜索功能,但严格意义上不能称为真正的搜索引擎,只是按目录分类的网站链接列表而已。用户完全可以按照分类目录找到所需要的信息,不依靠关键词(Keywords)进行查询。
与全文搜索引擎相比,目录索引有许多不同之处。
首先,搜索引擎属于自动网站检索,而目录索引则完全依赖手工操作。用户提交网站后,目录编辑人员会亲自浏览你的网站,然后根据一套自定的评判标准甚至编辑人员的主观印象,决定是否接纳你的网站。其次,搜索引擎收录网站时,只要网站本身没有违反有关的规则,一般都能登录成功;而目录索引对网站的要求则高得多,有时即使登录多次也不一定成功。尤其像Yahoo这样的超级索引,登录更是困难。
此外,在登录搜索引擎时,一般不用考虑网站的分类问题,而登录目录索引时则必须将网站放在一个最合适的目录(Directory)。
最后,搜索引擎中各网站的有关信息都是从用户网页中自动提取的,所以用户的角度看,我们拥有更多的自主权;而目录索引则要求必须手工另外填写网站信息,而且还有各种各样的*。更有甚者,如果工作人员认为你提交网站的目录、网站信息不合适,他可以随时对其进行调整,当然事先是不会和你商量的。
搜索引擎与目录索引有相互融合渗透的趋势。一些纯粹的全文搜索引擎也提供目录搜索,如Google就借用Open Directory目录提供分类查询。而像Yahoo! ;这些老牌目录索引则通过与Google等搜索引擎合作扩大搜索范围(注)。在默认搜索模式下,一些目录类搜索引擎首先返回的是自己目录中匹配的网站,如中国的搜狐、新浪、网易等;而另外一些则默认的是网页搜索,如Yahoo。这种引擎的特点是找的准确率比较高。
元搜索
元搜索引擎(METASearch Engine)接受用户查询请求后,同时在多个搜索引擎上搜索,并将结果返回给用户。著名的元搜索引擎有InfoSpace、Dogpile、Vivisimo等,中文元搜索引擎中具代表性的是搜星搜索引擎。在搜索结果排列方面,有的直接按来源排列搜索结果,如Dogpile;有的则按自定的规则将结果重新排列组合,如Vivisimo。
搜索引擎开发步骤?
首先,在进行开发网站之前,我们要先考虑一下网站的体系结构。一个完整 的搜索引擎主要包括三个总分:网页搜集、网页预处理和提供查询服务,这 三个总分之间的关系是相互独立又紧密连接。这就好比如考虑是要开发一个 全文索引还是目录索引的搜索网站。其次,我们要准备一个网络爬虫(俗称“蜘蛛:spider”)...
数据集成平台
数据集成平台是广东轻亿云软件科技有限公司的核心产品之一,旨在为企业提供高效、稳定的数据整合解决方案。该平台能够灵活连接各种数据源,实现数据的统一管理和高效利用。通过数据集成平台,企业可以轻松地整合内部和外部数据,消除数据孤岛,提高数据质量,从而为业务决策和创新发展提供有力支持。同时,平台还具备高度可定制性和扩展性,能够满足不同行业和企业的特定需求,助力企业实现数字化转型和升级。广东轻亿云软件科技有限公司是一家数字化服务提供商,致力于专业的数据集成,数据运营,数据分析服务领域, 使繁杂数字化应用从此变得简单,易用,构建万物互联的数字化企业。目前我们已经为100+原厂软件提供了全场景的系统集成能力,为500+客户提...
搜索引擎评价体系应该分几个方面
1、对于搜索引擎系统而言,语料库集合就是指万维网数据的全体,搜索引擎需要利用网页抓取子系统自行获取万维网数据。2、查询样例集合构建:(真实性,代表性,信息需求表达的完整性)虽然搜索引擎每日需要处理的用户查询数目十分庞大,但是进一步观察查询频率的分布时,将会发现,搜索引擎查询频度的分布在很大程...
浏览器和搜索引擎有什么区别?
体系结构 搜索引擎基本结构一般包括:搜索器、索引器、检索器、用户接口等四个功能模块。1、搜索器:搜索器也叫网络蜘蛛,是搜索引擎用来爬行和抓取网页的一个自动程序,在系统后台不停歇地在互联网各个节点爬行,在爬行过程中尽可能快的发现和抓取网页。2、索引器。它的主要功能是理解搜索器所采集的网页...
常用的搜索引擎有哪些
搜索引擎(search engines)是对互联网上的信息资源进行搜集整理,然后供你查询的系统,它包括信息搜集、信息整理和用户查询三部分。搜索引擎是一个为你提供信息“检索”服务的网站,它使用某些程序把因特网上的所有信息归类以帮助人们在茫茫网海中搜寻到所需要的信息。早期的搜索引擎是把因特网中的资源服务器的地址收集起...
搜索引擎分为哪几类
目录索引:通过人工分类整理网站信息,提供分类目录查询。元搜索引擎:在多个搜索引擎上搜索并返回结果,有的按来源排列,有的按自定规则排列。问题五:常用的搜索引擎分类 全文搜索引擎:如Google、百度。目录搜索引擎:如Yahoo、新浪分类目录搜索。元搜索引擎:如InfoSpace、搜星。问题六:中国主要的搜索引擎...
什么是目录索引类,元,全文搜索引擎?
问题六:搜索引擎的主要体系包括哪些 搜索引擎(Search Engine)是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户的系统。搜索引擎包括全文索引、目录索引、元搜索引擎、垂直搜索引擎、 *** 式搜索引擎、门户搜索引擎与免费链接列表...
加分求搜索引擎的工作机制
图2描述了一般搜索引擎的系统架构,其中包括页面搜集器、索引器、检索器、索引文件等部分,下面对其中的主要部分的功能实现进行了介绍。 图2 搜索引擎各个组成部分的关系 搜集器 搜集器的功能是在互联网中漫游,发现并搜集信息,它搜集的信息类型多种多样,包括HTML页面、XML文档、Newsgroup文章、FTP文件、字处理文档、多...
搜索引擎分为哪几类
其他还包括去除重复网页、分析超链接、计算网页的重要度。 3、提供检索服务 用户输入关键词进行检索,搜索引擎从索引数据库中找到匹配该关键词的网页;为了用户便于判断,除了网页标题和URL外,还会提供一段来自网页的摘要以及其他信息。 问题二:搜索引擎都有哪几种类型 搜索引擎主要分类,及特点: 一、全文索引 ...
有赞搜索引擎实践(算法篇)
搜索引擎主要3个部件构成. 第一, hadoop集群, 用于生成大规模搜索和实时索引; 第二, ElasticSearch集群, 提供分布式搜索方案; 第三, 高级搜索集群, 用于提供商业搜索的特殊功能. 商业电商搜索由于搜索的特殊性, 独立的ElasticSearch集群是无法满足多样的算法需求的, 我们在搜索的各个部件上都有相应的算法插件, 用于...
知识搜索引擎的介绍
知识搜索引擎(Knowledge search engine)并非单纯的是一种搜索工具,它首先是知识管理的一种实现理念与工具,承担了“知识汇聚、知识发现、知识分类、知识聚类、知识门户的构建”,通过搜索引擎技术完成知识管理的使命。知识搜索引擎、知识分类体系、知识专家网络共同构成了当今世界上先进知识管理系统的主要内涵。