CDA117526

2022-03-11   阅读量: 451

Python

十个有用的python包

扫码加入数据分析学习群
1. Dash

Dash是用纯Python构建数据可视化app的理想选择,因此特别适合处理数据做大屏展示的人


Dash是Flask,Plotly.js和React.js的混合体,示例图如下:


图片

2. Pillow

Pillow专门用于处理图像,你可以使用该库创建缩略图,在文件格式之间转换,旋转,应用滤镜,显示图像等等。

之前的文章有多篇都提到了这个包,例如图片批量加水印办公自动化等等,只要是需要对图像进行操作的,这个包就是理想的选择。

以下是来自于github上的示例代码(下同):

图片

3. Requests

Requests建立在世界上下载量最大的Python库urllib3上,它令Web请求变得非常简单,功能强大且用途广泛。


以下是它的示例代码,非常的简单:


图片


Requests可以完成很多高级的工作,例如:


  • 认证
  • 使用cookie
  • 执行POST,PUT,DELETE等
  • 使用自定义证书
  • 使用会话Session
  • 使用代理等
4. Simplejson

需要提一嘴的是:Python的json是simplejson。也就是Python采用了simplejson的一个版本,并将其合并到每个发行版中。

所以呢,相当于simplejson是个大容器,Python只是用了其中的一个而已。

使用simplejson具有一些优点:

  • 它适用于更多Python版本。
  • 它具有用C编写的部分,因此非常快速。

对了,可能在使用JSON的脚本中你会看到以下内容,大概就是这个那句话的一个完美复现了:

<span https:="" mmbiz.qpic.cn="" mmbiz_svg="" qzptzqiza0nzgjdeem7e56wicuya3kv9jjphvn0wq0mxrbuzbgdibptibocfhyibtoqdnazibaicsa68h9qthar71xhdyloscyxwjs="" 640?wx_fmt="svg")" 10px="" 40px="" no-repeat="" rgb(40,="" 44,="" 52);="" height:="" 30px;="" width:="" 655px;="" border-radius:="" 5px;"="" style="padding: 0px; margin: 0px 0px -7px; list-style: none; box-sizing: border-box !important; outline: 0px; max-width: 100%; display: block; background: url(""); overflow-wrap: break-word !important;">
5. Emoji

Emoji库是一个表情包库,比较的有意思,特别是在分析媒体数据时,例如微博、知乎等,用户评论里面就会有很多的Emoji,这个时候就会用上Emoji包

图片



以下是它的示例代码,非常的简单:


图片

6. Python-dateutil

python-dateutil模块提供了对标准datetime模块的强大扩展。

你可以使用此库做很多额外的日期处理,而且处理起来相当的方便,例如:

  • 计算相对增量(下个月,下周一等)和两个给定日期对象之间的相对增量

  • 根据重复规则计算日期

  • 获取最新世界时区信息

  • 计算任意一年的某个节假日的周日日期等

7. 进度条

进度条里面有两个包可以关注下,分别是:progress或tqdm,都比较有意思:

progress

借助这个软件包,可以轻松创建进度条:

图片

tqdm

tqdm的功能大致相同,演示如下:

图片


8. IPython


Python的交互式外壳,这是运行Python的一个比较好的方法。


图片


增强的IPython shell提供的一些功能包括:


  • 输入历史记录,跨会话持续存在

  • 在具有自动生成的引用的会话期间缓存输出结果。

  • 制表符补全,默认情况下支持python变量和关键字,文件名和函数关键字的补全。

  • “魔术”命令,用于控制环境并执行许多与IPython或操作系统相关的任务。

  • 会话记录和重新加载。

  • 对pdb调试器和Python分析器的集成访问。

  • 允许并行和分布式计算。

IPython是Jupyter Notebook的核心,它是一个开放源代码Web应用程序,可以让你创建和共享包含实时代码,方程式,可视化效果和叙述文本的文档。

9. Flask

Flask库可以用于创建快速的Web服务或简单的网站。

而且有一点,Flask是一个微框架,这意味着Flask不但可以保证核心简单而且还支持扩展。

相比,很多大型的Web应用框架,例如Django,使用起来就相对麻烦很多

10. BeautifulSoup

如果你从网站上提取了一些HTML,则需要对其进行解析以获取实际所需的内容。

Beautiful Soup是一个Python库,用于从HTML和XML文件中提取数据。它提供了导航,搜索和修改解析树的简单方法。这个其实以前专门有写过一篇介绍的文章,链接如下:Python爬虫-BeautifulSoup详解

BeautifulSoup的一些主要功能:

  • 会自动将传入文档转换为Unicode,将传出文档转换为UTF-8,考虑编码。

  • 会解析你提供的任何内容,并进行树的遍历。

  • 语法使用比较简单,类似的如“查找所有链接”,或“查找带有粗体的表格标题“等


255.3886 3 0 关注作者 收藏

评论(0)


暂无数据

推荐课程

推荐帖子