2024年4月11日发(作者:)
八爪鱼采集过程中常出现的问题以及解决方法
本教程主要讲的是如果你在使用八爪鱼采集时遇到一些问题,如何快速找出错误、解
决错误或者如何了解错误、更好的和客服沟通的方法。
八爪鱼采集器主要通过技术将用户浏览网页的操作进行定位和模拟来收集数据,用户
不需要明白网页架构、数据采集原理等技能,通过八爪鱼采集器就可以构成八爪鱼可以看
懂的、可以循环工作的采集流程。
如果存在采集模式不满足需求的情况,排错后面有更加详细的教程。
采集过程中出现的错误可以归类为五个方面,分别是网页问题、规则问题、定位模拟
问题、采集器问题、以及云端问题。当采集出现异常时,请先按照如下流程进行错误排查,
寻找问题类型:
1、手动执行一遍规则:打开界面右上角的流程图,用鼠标点击流程
图内规则,从上至下,每次点击下一步都有相应反应,没有发生反应的步骤则是问题出现
步骤。
注意点:
1)循环内的点击以及提取元素要手动选择循环中除第一个以外的内容,防止循环失效,
只点击提取循环内第一个元素
2)所有规则每一步执行完才执行下一步,网页未加载完全,即浏览器上圆圈等待图标
未消失时,观察网页内容是否加载完全,如果加载完全可以自行取消加载,再配置规则。
2、进行单机采集,查看采集结果中未采集到数据的项目。
注意点:规则中最好加入当前网址,这样出现未采集到数据的项目,可以复制网址在
浏览器中打开查看原因,确定错误。
下面分别将可能出现问题的现象叙述如下,供你参考:
1、手动执行步骤无反应
可能现象有两种:
1)未正常执行步骤
原因:规则问题、采集器问题、定位模拟问题
解决方法:
可进行排查,删除该步骤,重新添加一遍,如果还是无法执行,则排除了规则问题,
你可以:
将该网页在浏览器打开进行操作,如果一些滚动翻页或点击翻页在浏览器可以执行而
采集器中不能执行,则是采集器问题,原因是采集器内镶浏览器为火狐浏览器,可能是内
镶的浏览器版本在随后的版本发生了变化,导致在浏览器可以实现的功能,在采集器内镶
发布评论