后羿采集器如何识别一行里其中一个标题
发布网友
发布时间:2022-04-29 00:30
我来回答
共1个回答
热心网友
时间:2022-06-26 11:33
解决此问题的具体操作方法如下:一、下载安装后羿采集器,并注册登录;
二、新建采集任务:
1、复制你所想要采集数据的网址。(需要搜索结果页的网址,而不是首页的网址)
2、新建智能模式采集任务,可以在软件上直接新建采集任务,也可以通过导入规则来创建任务。
三、配置采集规则:
1、设置提取数据字段。在智能模式下,我们输入网址后软件即可自动识别出页面上的数据并生成采集结果,每一类数据对应一个采集字段,我们可以右击字段进行相关设置,包括修改字段名称、增减字段、处理数据等。
2、增加特殊字段,由于我们需要实时采集数据,可以在字段内增加一个"采集时间”的特殊字段。
四、设置并启动采集任务:
1、设置采集任务。完成了采集字段的添加,我们可以开始启动采集任务了。在启动之前我们需要对采集任务进行一些设置,从而提高采集的稳定性和成功率。点击”设置”按钮,在弹出的运行设置页面中我们可以进行运行设置和防屏蔽设置,这里勾选“跳过继续采集”,设置"2" 秒请求等待时间,勾选“不加载网页图片”,防屏蔽设置就按照系统默认设置,然后点击保存。
2、启动采集任务:(1)设置定时采集,我们需要实时采集股票信息,个人专业版及以上用户可以设置定时采集功能实时采集,我们设置隔一个小时自动采集一次数据,普通用户可以设置一个固定时间点去运行采集任务。
(2)自动入库。个人专业版及以上用户在使用定时采集时搭配自动入库使用,可将采集到的数据实时发送到数据库,方便用户使用数据。
3、运行任务提取数据。系统开始自动采集数据,等待一会儿, 便可看到采集到的东方财富网行情中心股票的数据。首次运行结束之后,任务会每隔一个小时自动运行一次, 并且会将数据自动发布到数据库。注意:软件关闭任务就无法运行,若要实时采集数据请不要关闭后羿采集器。
五、导出并查看数据:
数据采集完成后,可以导出数据,选择导出的文件类型,点击"确认导出”,如果没有使用数据库的用户,需要查看新识别的数据,可以鼠标右键点击“任务”—“查看数据” 。