2020-12-24
阅读量:
526
爬虫的分类
根据使用场景,网络爬虫可分为通用爬虫和聚焦爬虫两种。通用网络爬虫是捜索引擎抓取系统(Baidu、Google、Yahoo等)的重要组成部 分。主要的是将互联网上的下载到本地通用网络爬虫从互联网中搜集,采集信息,这些信息为搜索引擎提供支持,它决定着整个引擎系统的内容是否丰富,信息是否即时,因此其性能的优劣直接影响着搜索引擎的效果。
聚焦爬虫
聚焦爬虫,是向特定主题需求的一种网络爬虫程序,它与通用搜索引擎爬虫的区别在于: 聚焦爬虫在实施抓取时会对内容筛选,尽量保证只抓取与需求相关的信息。






评论(0)


暂无数据
推荐帖子
0条评论
0条评论
0条评论