问答文章1 问答文章501 问答文章1001 问答文章1501 问答文章2001 问答文章2501 问答文章3001 问答文章3501 问答文章4001 问答文章4501 问答文章5001 问答文章5501 问答文章6001 问答文章6501 问答文章7001 问答文章7501 问答文章8001 问答文章8501 问答文章9001 问答文章9501
你好,欢迎来到懂视!登录注册
当前位置: 首页 - 正文

什么是搜索引擎及搜索引擎的工作原理

发布网友 发布时间:2022-04-24 18:37

我来回答

1个回答

热心网友 时间:2022-04-12 19:23

搜索引擎(Search Engine)是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户的系统。搜索引擎包括全文索引、目录索引、元搜索引擎、垂直搜索引擎、集合式搜索引擎、门户搜索引擎与免费链接列表等。

工作原理

第一步:爬行

搜索引擎是通过一种特定规律的软件跟踪网页的链接,从一个链接爬到另外一个链接,像蜘蛛在蜘蛛网上爬行一样,所以被称为“蜘蛛”也被称为“机器人”。搜索引擎蜘蛛的爬行是被输入了一定的规则的,它需要遵从一些命令或文件的内容。

第二步:抓取存储

搜索引擎是通过蜘蛛跟踪链接爬行到网页,并将爬行的数据存入原始页面数据库。其中的页面数据与用户浏览器得到的HTML是完全一样的。搜索引擎蜘蛛在抓取页面时,也做一定的重复内容检测,一旦遇到权重很低的网站上有大量抄袭、采集或者复制的内容,很可能就不再爬行。

第三步:预处理

搜索引擎将蜘蛛抓取回来的页面,进行各种步骤的预处理。

⒈提取文字

⒉中文分词

⒊去停止词

⒋消除噪音(搜索引擎需要识别并消除这些噪声,比如版权声明文字、导航条、广告等……)

5.正向索引

6.倒排索引

7.链接关系计算

8.特殊文件处理

除了HTML 文件外,搜索引擎通常还能抓取和索引以文字为基础的多种文件类型,如
PDF、Word、WPS、XLS、PPT、TXT 文件等。我们在搜索结果中也经常会看到这些文件类型。 但搜索引擎还不能处理图片、视频、Flash
这类非文字内容,也不能执行脚本和程序。

第四步:排名

用户在搜索框输入关键词后,排名程序调用索引库数据,计算排名显示给用户,排名过程与用户直接互动的。但是,由于搜索引擎的数据量庞大,虽然能达到每日都有小的更新,但是一般情况搜索引擎的排名规则都是根据日、周、月阶段性不同幅度的更新。

选择

与网站内容相关

搜索次数多,竞争小

主关键词,不可太宽泛

主关键词,不太特殊

商业价值

提取文字

中文分词

去停止词

消除噪声

去重

正向索引

倒排索引

链接关系计算

特殊文件处理
什么是搜索引擎?

搜索引擎是一个对互联网信息资源进行搜索整理和分类,并储存在网络数据库中供用户查询的系统,包括信息搜集、信息分类、用户查询三部分。工作原理 1.爬行:搜索引擎是通过一种特定规律的软件跟踪网页的链接,从一个链接爬到另外一个链接,像蜘蛛在蜘蛛网上爬行一样,所以被称为“蜘蛛”也被称为“机器人”...

什么是搜索引擎及搜索引擎的工作原理

搜索引擎(Search Engine)是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户的系统。搜索引擎包括全文索引、目录索引、元搜索引擎、垂直搜索引擎、集合式搜索引擎、门户搜索引擎与免费链接列表等。工作原理 第一步:...

什么是搜索引擎?举例说明!

查询速度当然是搜索引擎的重要指标,优秀的搜索工具内部应该有一个含时间变量的数据库,能保证所查询的信息都是最新的和最全面的。2、准确 准确性高是我们使用搜索引擎的宗旨。好的搜索引擎内部应该含有一个相当准确的搜索程序,搜索精度高,查到的信息总能与我们的要求相符。3、易用 易用也是我们选择搜...

什么是搜索引擎

1、所谓搜索引擎,就是根据用户需求与一定算法,运用特定策略从互联网检索出制定信息反馈给用户的一门检索技术。搜索引擎依托于多种技术,如网络爬虫技术、检索排序技术、网页处理技术、大数据处理技术、自然语言处理技术等,为信息检索用户提供快速、高相关性的信息服务。搜索引擎技术的核心模块一般包括爬虫、索...

搜索引擎的工作原理是什么,搜索引擎优化具体又该如何操作呢?

工作原理 1、抓取网页 每个独立的搜索引擎都有自己的网页抓取程序(spider)。Spider顺着网页中的超链接,连续地抓取网页。被抓取的网页被称之为网页快照。由于互联网中超链接的应用很普遍,理论上,从一定范围的网页出发,就能搜集到绝大多数的网页。2、处理网页 搜索引擎抓到网页后,还要做大量的预处理...

什么是搜索引擎?作用是什么?

搜索引擎(Search Engine)是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户的系统。搜索引擎包括全文索引、目录索引、元搜索引擎、垂直搜索引擎、集合式搜索引擎、门户搜索引擎与免费链接列表等。比如百度就是一款...

搜索引擎的工作原理是什么?

搜索引擎的工作原理总共有四步:第一步:爬行,搜索引擎是通过一种特定规律的软件跟踪网页的链接,从一个链接爬到另外一个链 接,所以称为爬行。第二步:抓取存储,搜索引擎是通过蜘蛛跟踪链接爬行到网页,并将爬行的数据存入原始页面数据库。第三步:预处理,搜索引擎将蜘蛛抓取回来的页面,进行各种步骤...

什么是搜索引擎的工作原理?

搜索引擎的工作原理主要就是四个步骤:爬行,抓取,检索,显示。搜索引擎放出蜘蛛在互联网上爬行,目的是为了发现新的网站和最新的网页内容,从而经过搜索引擎特定程序分析后决定是否抓取这些信息,抓取后然后将其放到索引数据库中,顾客在搜索引擎网站上检索信息时,就会在结果页上出现与检索词相关的信息,并...

什么叫搜索引擎?

搜索引擎(search engines)是对互联网上的信息资源进行搜集整理,然后供你查询的系统,它包括信息搜集、信息整理和用户查询三部分。搜索引擎是一个为你提供信息“检索”服务的网站,它使用某些程序把因特网上的所有信息归类以帮助人们在茫茫网海中搜寻到所需要的信息。一、什么叫搜索引擎?在Internet上有上...

搜索引擎的搜索原理是什么?

搜索引擎的工作原理:1、搜集信息 搜索引擎的信息搜集基本都是自动的。搜索引擎利用称为网络蜘蛛的自动搜索机器人程序来连上每一个网页上的超链接。机器人程序根据网页连到其中的超链接,就像日常生活中所说的一传十,十传百,从少数几个网页开始,连到数据库上所有到其他网页的链接。理论上,若网页上...

声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。
E-MAIL:11247931@qq.com
天童英语教材3到6岁的要多少钱 三星ST500三星st500简介 国歌得来源? 女生自拍相机用什么好 理由~如题 谢谢了 有哪些又帅又时尚的男生发型? PL120三星数码相机- 为你展现生活细节的高清利器 进入大学学生会有什么好处,哪个部门最好 去哪家能买到质量好便宜的手套啊? ...只剩下计算机、回收站等,连浏览器的收藏夹都清空了 为什么系统重装以后桌面上只剩下一个回收站了? 搜索引擎的原理是 参心坐标系和地心坐标系的区别 什么是搜索引擎,其工作原理是什么 搜索引擎的基本工作原理包括哪三个过程 全文搜索引擎一般采用什么原理来采集信息 全文搜索引擎的工作原理是什么? 怎样做地三鲜才能做到茄子外酥里嫩呢 地三鲜要怎么做才好吃,哪里可以学? 做地三鲜茄子的时候,怎么做茄子才不会吸油? 地三鲜茄子怎么做好吃 东北特色菜- 地三鲜(烧茄子)的好吃做法? 地三鲜的家常做法,地三鲜怎么做 上海耐腐阀门集团有限公司怎么样? 电火花检漏仪与防腐层探测检漏仪哪种是用于地上管道的检测的啊 怎样做地三鲜 电火花检测仪 是干什么的 什么情况下需要做防腐层电火花检测? 电火花检测仪电压最少为多少 电火花检测仪在使用的时候有哪些注意事项 电火花检测仪与钢丝绳探伤仪有什么区别?sh07 大地坐标系有哪些类型? 谁能给我解释一下搜索引擎的工作原理? 参心坐标系最后一定要转换为地心坐标系吗?参考椭球是不是和总地球椭球一样大? L(B)在工程测量中什么意思? 全文搜索引擎工作原理特点举例 测量方面坐标系有几种,分别为什么,知道的请详细告知 全文搜索引擎与目标索引类搜索引擎有什么区别? 象现在很多搜索引擎的原理是什么,比如百度,GOOGLE 搜索引擎的原理 地坐标系是大地测量的基本坐标系,其优点表现在什么方面 不注明那种大地坐标系的经纬度,是指什么坐标系? 什么是三心坐标系 参心坐标系与地心坐标系有哪些区别? 大地坐标系与地心,参心等坐标系的关系问题 团队展示VCR短片制作策划案 策划短视频的主要方法有哪些? 申请平安银行30万额度的信用卡需要查配偶的征信么? 年会总结视频方案 丈夫办便民卡妻子征信花了 公司周年庆视频策划方案 亲 求助啊 需要一个策划方案 和视频拍摄方案 重点是视频
  • 焦点

最新推荐

猜你喜欢

热门推荐