火车头采集器采集文章内容[精编图文版]
1、打开火车头采集器,接着我们上一节讲到采集文章列表,然后双击“文章列表”中的一条文章网址
![火车头采集器采集文章内容[精编图文版]](https://exp-picture.cdn.bcebos.com/05e24be983aee8d757a6435c6b781431deb66623.jpg)
2、进入到文章内容采集编辑页面,点击 测试 按钮,可以看到已经获取文章
![火车头采集器采集文章内容[精编图文版]](https://exp-picture.cdn.bcebos.com/586bfdefe0781431cd3a92dfdc6699cf03536223.jpg)
3、我们可以看到获取的文章里有很多无用的标签和内容,需要我们来规定采集的区域,在浏览器中打开目标采集网址,右键查看源代码,找到文章内容的开始和结束标签。
![火车头采集器采集文章内容[精编图文版]](https://exp-picture.cdn.bcebos.com/1570c1b6326c57668c43a2e0a4632385e1366123.jpg)
4、双击 内容 标签,打开后将找到的开始和结束标签,放到对应的框里面,然后单击 确定,然后进行畲驶郜杏测试,可以看到文章内容已经采集到了。
![火车头采集器采集文章内容[精编图文版]](https://exp-picture.cdn.bcebos.com/562787cf02532f633b094085699147e832e05c23.jpg)
![火车头采集器采集文章内容[精编图文版]](https://exp-picture.cdn.bcebos.com/031231632385e036f81de75bb8e039723c035a23.jpg)
5、我们可以看到有很多没有用的标签,需要去除无用标签,双击 内容 标签,在HTML标签排除中去掉无用的标签。
![火车头采集器采集文章内容[精编图文版]](https://exp-picture.cdn.bcebos.com/22c4fe36e29147e82f6c99c1b603bbea3f865823.jpg)
![火车头采集器采集文章内容[精编图文版]](https://exp-picture.cdn.bcebos.com/e3d059e833e03972238f1b59b586304860435623.jpg)
6、这样我们的文章就采集成功了!
![火车头采集器采集文章内容[精编图文版]](https://exp-picture.cdn.bcebos.com/38332303bbea3e8611c4c1f05cd4483105eb5523.jpg)