2024年6月1日发(作者:)

1、 下载的压缩包,随便找个地方解压缩就好,不需要安装。

2、 点击文件夹里的文件,执行程序,会打开该软件的主界面

如果有提示出错而打不开,那么是你的电脑缺乏软件所需要的环境,请到下面这个网站

/去下载.net框架(红色字链接,直接下载安装就好)

3、 以聚美优团为例,首先新建一个任务,名字为聚美优团

网页编码选择utf-8,这个是很多网站都用到的文字编码,减少乱码。

4、 打开聚美优团的网站,发现有过往团购的历史,点击下一页后,其网页地址为:

/i/deal/deals?filter=2-0-0-0,再翻一页,其网页地址为:

/i/deal/deals?filter=3-0-0-0。所以推测其规律为:

/i/deal/deals?filter=*-0-0-0,*表示一个不断递增的自然数参数。

5、 起始网址现在为空,点击旁边的添加,出来一个对话框,选择批量多页

选择页数的那个数字,选中它后,然后点击右边的蓝色*符号,于是这个网址变成:

大家注意看,输入框内的*符号变成绿色粗体的了,而且下面出现了按照这个规律递增的5

个网址。这里作为实例,我们就选一个比较小的数字,而实际爬取的时候,根据实际情况修

改选项中的起止数字。

6、 点击网址旁边的“添加”按钮,然后在下面会出现一个表达式,这个是自动生成的,不

用修改。

然后点击完成,返回编辑任务对话框。

7、 点击第二步,进入采集信息设置的地方,在这里需要确定我们在这个页面上要采集哪些

数据

我们回到聚美优网上,看看我们需要什么数据: