2019-01-29
阅读量:
1463
【推荐】傻瓜式爬虫软件——八爪鱼
八爪鱼的出现,对于爬虫爱好者来说喜忧参半。
喜的往往是初学者,通过点击式操作即可实现数据的采集,降低了掌握爬虫技术的门槛;忧的是懂一些爬虫技术的人,辛苦学来的代码可能还不如做好的模板使用的效率更高。
当然八爪鱼也有局限,例如模板更新慢,可爬取的字段与方式较为有限,以及收费等,爬虫的高级用户可以无视这个软件。
这里仅简单介绍一下这个软件的功能,给爬虫入门者多一个工具参考。
- 爬虫的原理,是“可见即可爬”,翻译给业务人员,就是将网站信息整理成结构化数据,相当于拓展了外部数据源,可以用来做舆情趋势监控等等

- 可爬取的网站,包括百度、淘宝、天猫、京东、豆瓣、微博、bilibili等;知乎的反爬措施非常高级,八爪鱼暂时没有提供爬去的模板

- 八爪鱼的采集模式有两种,简易模式和自定义模式,可爬取的字段与模式、模板对应
- 八爪鱼官网提供了操作教程,有需要的同学可以参考链接进一步了解了
参考链接:
http://www.bazhuayu.com/tutorialIndex






评论(0)


暂无数据
推荐帖子
2条评论
5条评论
6条评论