热线电话：13121318867

首页精彩阅读30个顶级Python库 | 用于深度学习、自然语言处理和计算机视觉

30个顶级Python库 | 用于深度学习、自然语言处理和计算机视觉

2022-02-28

30个顶级Python库 | 用于<a href='/map/shenduxuexi/' style='color:#000;font-size:inherit;'>深度学习</a>、<a href='/map/ziranyuyanchuli/' style='color:#000;font-size:inherit;'>自然语言处理</a>和<a href='/map/jisuanjishijue/' style='color:#000;font-size:inherit;'>计算机视觉</a>

CDA数据分析师出品

作者：Matthew Mayo

编译：Mika

今天我们来盘点一下有哪些用于深度学习、自然语言处理和计算机视觉的顶级Python库。

我们尽力将每个库按预期的使用情况进行归类，希望这能对大家有所帮助。

显然，现在并不是所有的自然语言处理和计算机视觉工作都是使用深度学习技术进行的，但随着趋势朝着这种技术的方向发展。

所有包含的库都有对应的Github代码仓库，我们还列出每个库的在Github上的收藏(Stars) ，提交(Commits )，贡献者(Contributors)的数据，这在一定程度上反映了库的流行度和使用情况。

接着让我们分别来看看由KDnuggets工作人员整理的用于深度学习、自然语言处理和计算机视觉的30个顶级Python库。

深度学习

1. TensorFlow

收藏: 149000, 提交: 97741, 贡献者: 2754

TensorFlow是一个用于机器学习的端到端开源平台。它有一个全面的、灵活的工具、库和社区资源的生态系统，让研究人员推动机器学习的最先进技术，让开发人员轻松建立和部署机器学习驱动的应用程序。

2. Keras

收藏: 50000, 提交: 5349, 贡献者：864

Keras是一个用Python编写的深度学习API，运行在机器学习平台TensorFlow的基础上。

3. PyTorch

收藏: 43200, 提交: 30696, 贡献者：1619

Python中的张量和动态神经网络，具有强大的GPU加速能力

4. fastai

收藏: 19800, 提交: 1450, 贡献者: 607

fastai使用现代最佳实践简化了快速、准确的神经网络训练。

5. PyTorch Lightning

收藏: 9600, 提交: 3594, 贡献者：317

用于高性能人工智能研究的轻量级PyTorch封装。

6. JAX

收藏: 10000, 提交: 5708, 贡献者：221

Python+NumPy程序的可组合转换：区分、矢量化、JIT到GPU/TPU等

7. MXNet

收藏: 19100, 提交: 11387, 贡献者: 839

轻量级、便携、灵活的分布式、移动式深度学习，具有动态、突变意识的数据流调度器；适用于Python、R、Julia、Scala、Go、Javascript等。

8. Ignite

收藏: 3100, 提交: 747, 贡献者: 112

帮助PyTorch中的神经网络灵活透明地进行训练和评估的高级库。

自然语言处理(NLP)

9. FastText

收藏: 21700, 提交: 379, 贡献者：47

FastText是一个用于高效学习单词表示法和句子分类的库。

10. spaCy

收藏: 17400, 提交: 11628, 贡献者: 482

使用Python和Cython的强大自然语言处理。

11. gensim

收藏: 11200, 提交: 4024, 贡献者: 361

用于主题建模、文档索引和大型语料库相似度检索的Python库。目标受众是自然语言处理和信息检索社区。

12. NLTK

收藏：9300，提交：13990，贡献者：319

开源的Python模块、数据集和教程，支持自然语言处理方面的研究和开发。

13. Datasets (Huggingface开发)

收藏：4300，提交：568，贡献者：64

在PyTorch、TensorFlow、NumPy和Pandas中为自然语言处理等提供快速、高效、开放的数据集和评估指标。

14. Tokenizers（Huggingface开发）

收藏：3800，提交：1252，贡献者：30

为研究和生产而优化的最先进快速标记器

15. Transformers（Huggingface开发）

收藏：3500，提交：5480，贡献者：585

用于Pytorch和TensorFlow 2.0的最先进的自然语言处理。

16. Stanza

收藏：4800，提交：1514，贡献者：19

用于许多人类语言的斯坦福自然语言Python官方库

17. TextBlob

收藏：7300，提交：542，贡献者：24

简单、Python式的、具有文本处理—情绪分析、词性标注、名词短语提取、翻译等等功能。

18. PyTorch NLP

收藏：1800人，提交：442人，贡献者：15人

用于PyTorch 自然语言处理的基本工具

19. Textacy

收藏：1500人，提交：1324人，贡献者：23人

用于执行各种自然语言处理任务的Python库，建立在高性能spaCy库的基础上。

20. Finetune

收藏: 626, 提交: 1405, 贡献者: 13

允许用户利用最先进的预训练的自然语言处理模型来完成各种下游任务。

21. TextHero

收藏: 1900, 提交: 266, 贡献者: 17

从头开始，数量用于文本预处理、表示和可视化。

22. Spark NLP

收藏: 1700, 提交: 4363, 贡献者：50

Spark NLP是一个建立在Apache Spark ML之上的自然语言处理库。

23. GluonNLP

收藏: 2200, 提交: 712, 贡献者: 72

GluonNLP是一个工具包，可以轻松实现文本预处理、数据集加载和神经模型构建，帮助你加快自然语言处理（NLP）研究。

计算机视觉

24. Pillow

收藏：7800，提交：10799，贡献者：303

Pillow是很不错的Python成像库分叉。

25. OpenCV

收藏：49600，提交：29453，贡献者：1234

开源计算机视觉库

26. scikit-image

收藏：4000，提交：12352，贡献者：403

Python中的图像处理

27. Mahotas

收藏：644人，提交：1273人，贡献者：25人

快速计算机视觉算法库（为了提高速度，全部用C++实现），在numpy数组上运行。

28. Simple-CV

收藏：2400人，提交：2625人，贡献者：69人

开源机器视觉框架，使用OpenCV和Python编程语言。

29. GluonCV

收藏：4300，提交：774，贡献者：101

提供了计算机视觉中最先进的（SOTA）深度学习模型的实现。

30. Torchvision

收藏：7500，提交：1286，贡献者：334

软件包包括流行的数据集、模型架构和用于计算机视觉的常见图像转换。

结语：

以上就是30个你值得了解的用于深度学习、自然语言处理和计算机视觉的顶级Python库，希望能对你有所帮助。

CDA数据分析师考试相关入口一览（建议收藏）：

▷ 想报名CDA认证考试，点击>>> “CDA报名” 了解CDA考试详情；

▷ 想学习CDA考试教材，点击>>> “CDA教材” 了解CDA考试教材；

▷ 想加入CDA考试题库，点击>>> “CDA题库” 了解CDA考试题库；

▷ 想了解CDA考试含金量，点击>>> “CDA含金量” 了解CDA考试详情；

▷ 想了解CDA院校合作，点击>>> “院校合作” 了解咨询CDA院校合作；

自然语言处理计算机视觉深度学习 PyTorch NLP 机器学习神经网络 OpenCV

数据分析咨询请扫描二维码

若不方便扫码，搜微信号：CDAshujufenxi

上一篇年轻人为什么会猝死？这篇Python数据分析报告不可错过

下一篇基于同步行为的反欺诈算法SynchroTrap实现细节

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

京公网安备 11010802034615号经营许可证编号：京B2-20210330

联系电话：13321103290 (微信同号)

客服在线

立即咨询

客服在线

立即咨询

免密码登录

提交首次登录验证后自动注册

30个顶级Python库 | 用于深度学习、自然语言处理和计算机视觉

深度学习

自然语言处理(NLP)

计算机视觉

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

CDA 持证人专访：杨迅谈保险行业数据产品与数据中台 ...

【CDA干货】MySQL分表数据读取：核心方案、查询优化 ...

从“凭感觉”到“有章法”：CDA数据分析师视角下的 ...

【CDA干货】面板数据聚类分析：方法原理、实操流程 ...

以指标为锚，以体系为纲：CDA数据分析师视角下的指 ...

CDA “暑期学生报名送教材” 活动已开启！ ...

【CDA干货】金融行业运营风险监测：核心统计分析方 ...

【CDA干货】基于数据分析的财险潜在客户挖掘与精准 ...

从“杂乱数据”到“分析资产”：CDA数据分析师视角 ...

CDA持证人专访：何显臻谈餐饮行业数据分析与生产管 ...

【CDA干货】如何利用统计学方法开展数据分析：流程 ...

从“数据描述”到“业务预判”：CDA数据分析师视角 ...

【CDA干货】箱线图上下限计算原理、标准流程与异常 ...

【CDA干货】MySQL固定时间间隔数据查询：语法原理、 ...

从“杂乱信号”到“有序资产”：CDA数据分析师视角 ...

CDA持证人专访：周婧博谈会计行业数据分析与经营诊 ...

【CDA干货】问卷调查卡方检验：原理、前提与实战应 ...

从“整体波动”到“因子归因”：CDA数据分析师视角 ...

【CDA干货】单因素方差分析：三组及以上独立样本的 ...

【CDA干货】次日付费留存计算方法、统计口径与业务 ...

CDA教育闭环

常见问题

关于我们

CDA数据分析师公众号

CDA考试中心小程序

CDA数据分析师App下载