作者:陈熹
来源:早起Python
大家好,在之前的办公自动化系列文章中我们已经详细介绍了如何使用python批量处理PDF文件,包括合并、拆分、水印、加密等操作。
今天我们再次回到PDF,详细讲解如何使用python从PDF提取指定的信息。我们将以一份年度报告PDF为例进行介绍,内含大量文字、表格、图片,具体如下
模块安装
首先需要安装两个模块,第一个是pdfplumber,在命令行使用pip安装即可
数据分析咨询请扫描二维码