作者:陈熹
来源:早起Python
大家好,今天分享一个实用的办公脚本:将多个PDF合并为一个PDF,例如我手上现在有如下3个PDF分册,需要整合成一个完整的PDF
如果换成你操作的话,是不是打开百度搜索:PDF合并,然后去第三方网站操作,可能会收费不说还担心文件泄漏,现在有请Python出场,简单快速,光速合并,拿走就用!
首先导入需要的库和路径设置
import os from PyPDF2 import PdfFileReader, PdfFileWriter if __name__ == '__main__': # 设置存放多个pdf文件的文件夹 dir_path = r'C:\Scientific Research\Knowladge\Ophthalmology\Chinese Ophthalmology' # 目标文件的名字 file_name = "中华眼科学(第3版)合并版.pdf"
接着获取所有pdf文件的绝对路径,这里需要利用os库中的os.walk遍历文件和os.path.join拼接路径
for dirpath, dirs, files in os.walk(dir_path): print(dirpath) print(files) # 结果返回当前路径、当前路径下文件夹,并以列表返回所有文件
建议直接将需要合并的pdf放在一个文件夹,这样就无需再对文件后缀进行判断,包装成函数后如下:
def GetFileName(dir_path): file_list = [os.path.join(dirpath, filesname) \ for dirpath, dirs, files in os.walk(dir_path) \ for filesname in files] return file_list
调用该函数的结果
现在建立合并PDF的函数
def MergePDF(dir_path, file_name): # 实例化写入对象 output = PdfFileWriter() outputPages = 0 # 调用上一个函数获取全部文件的绝对路径 file_list = GetFileName(dir_path) for pdf_file in file_list: print("文件:%s" % pdf_file.split('\\')[-1], end=' ') # 读取PDF文件 input = PdfFileReader(open(pdf_file, "rb")) # 获得源PDF文件中页面总数 pageCount = input.getNumPages() outputPages += pageCount print("页数:%d" % pageCount) # 分别将page添加到输出output中 for iPage in range(pageCount): output.addPage(input.getPage(iPage)) print("\n合并后的总页数:%d" % outputPages) # 写入到目标PDF文件 print("PDF文件正在合并,请稍等......") with open(os.path.join(dir_path, file_name), "wb") as outputfile: # 注意这里的写法和正常的上下文文件写入是相反的 output.write(outputfile) print("PDF文件合并完成")
可以看到虽然待合并的PDF文件比较大,但是依旧快速的合并成功!最后附上完整代码,只需将代码中PDF的路径和文件名修改即可使用!
import os from PyPDF2 import PdfFileReader, PdfFileWriter def GetFileName(dir_path): file_list = [os.path.join(dirpath, filesname) \ for dirpath, dirs, files in os.walk(dir_path) \ for filesname in files] return file_list def MergePDF(dir_path, file_name): output = PdfFileWriter() outputPages = 0 file_list = GetFileName(dir_path) for pdf_file in file_list: print("文件:%s" % pdf_file.split('\\')[-1], end=' ') # 读取PDF文件 input = PdfFileReader(open(pdf_file, "rb")) # 获得源PDF文件中页面总数 pageCount = input.getNumPages() outputPages += pageCount print("页数:%d" % pageCount) # 分别将page添加到输出output中 for iPage in range(pageCount): output.addPage(input.getPage(iPage)) print("\n合并后的总页数:%d" % outputPages) # 写入到目标PDF文件 print("PDF文件正在合并,请稍等......") with open(os.path.join(dir_path, file_name), "wb") as outputfile: # 注意这里的写法和正常的上下文文件写入是相反的 output.write(outputfile) print("PDF文件合并完成") if __name__ == '__main__': # 设置存放多个pdf文件的文件夹 dir_path = r'C:\Scientific Research\Knowladge\Ophthalmology\Chinese Ophthalmology' # 目标文件的名字 file_name = "中华眼科学(第3版)合并版.pdf"MergePDF(dir_path, file_name)
——热门课程推荐:
想从事业务型数据分析师,您可以点击>>>“数据分析师”了解课程详情;
想从事大数据分析师,您可以点击>>>“大数据就业”了解课程详情;
想成为人工智能工程师,您可以点击>>>“人工智能就业”了解课程详情;
想了解Python数据分析,您可以点击>>>“Python数据分析师”了解课程详情;
想咨询互联网运营,你可以点击>>>“互联网运营就业班”了解课程详情;
数据分析咨询请扫描二维码
实习机会 数据分析师实习生在当今数据驱动的时代中拥有丰富的机会,但竞争也异常激烈。他们的日常工作包括从各个来源收集数据, ...
2024-12-02在当今数据驱动的时代,数据分析师的实习机会异常丰富且竞争激烈。本文将深入探讨数据分析师实习机会及建议,揭示行业内的关键信 ...
2024-12-02基础知识 统计学: 掌握数据分析的关键是理解统计学基本概念,如平均值、中位数和回归分析。这些概念为分析数据提供了重要框架 ...
2024-12-02基础知识 数据分析领域的入门之路并不是一帆风顺,就像搭建高楼大厦一样,需要坚实的基础。首先,我们来探讨几个关键的基础知识 ...
2024-12-02在当今信息爆炸的时代,数据成为企业决策的关键驱动力。成为一名优秀的数据分析师,并非仅仅掌握数据的本质,更需要具备多方面的 ...
2024-12-02数据收集与整理 数据分析师需要从多个来源收集数据,包括内部数据库、外部市场数据和社交媒体。 清洗和整理数据以确保准确性和 ...
2024-12-02在当今信息爆炸的时代,数据分析扮演着愈发关键的角色。从数据的收集、清洗、分析到最终的报告撰写,数据分析涵盖了广泛而深入的 ...
2024-12-02揭秘数据分析求职之路 在当今竞争激烈的就业市场中,数据分析专业的就业形势备受关注。究竟数据分析领域的求职难度如何?让我们 ...
2024-12-02数据分析就业挑战与应对策略 在当今社会,数据分析专业的就业并非一帆风顺。竞争激烈,技能要求高,许多人发现找工作并不容易。 ...
2024-12-02在追求成为一名出色的数据分析师的道路上,技术和软技能同样重要。技术技能涵盖了诸多方面,其中包括: 统计学知识 探索庞大数据 ...
2024-12-02从技术到软技能:数据分析的全貌 学习数据分析是一项综合性任务,涉及多方面技能。这些技能主要可以划分为技术技能和软技能两大 ...
2024-12-02作为初学者踏入数据分析领域,掌握一系列关键能力至关重要。这些技能不仅涵盖基础工具的使用,还包括深入的分析方法、对业务的理 ...
2024-12-02欢迎探寻数据分析的奇妙世界!对于初学者而言,融会贯通数据领域的复杂性可能有些令人望而却步。然而,不必惊慌,因为我们将一起 ...
2024-12-02欢迎踏上学习数据分析的旅程!数据已经渗透到我们生活的方方面面,成为决策和创新的关键。无论是提升工作效率、探索数据领域还是 ...
2024-12-02欢迎踏上数据分析的学习之旅!无论是为了提升工作效率,转行成为数据分析师,还是满足对数据分析的好奇心,掌握数据分析技能都将 ...
2024-12-02在当今数据驱动的世界中,选择合适的数据分析工具至关重要。不同工具在功能和应用场景上存在显著差异,影响着数据处理和分析的效 ...
2024-12-02选择适合你的数据分析工具 在进行数据分析时,选择合适的工具至关重要。不同工具有各自的特点和适用场景,因此了解每种工具的优 ...
2024-12-021. 技术驱动与市场需求 数据分析领域正随着技术的不断革新而迎来蓬勃发展。大数据、人工智能(AI)、机器学习(ML)等前沿技术的 ...
2024-12-02在当今数字化浪潮中,数据分析扮演着关键角色。数据分析能力的提升引领了行业趋势,深刻影响着各个领域:从技术进步到市场需求增 ...
2024-12-02如何用Excel提升数据分析能力 在数字时代中,数据是无处不在的。对于从业者而言,掌握数据分析的技能至关重要。而在众多数据处理 ...
2024-12-02