
来源:早起Python
作者:刘早起
大家好,我是早起。
在之前的办公自动化系列文章中,曾经介绍过很多将Excel指定字段提取到Word模版中指定位置的案例
从Excel到Word批量制作合同
在上述案例中,都要求有一个现成的Word模版才可以执行,那么如果现在没有Word模版,要求针对Excel指定内容批量生成Word该如何实现?
本文就将基于一个真实的办公案例进行讲解如何提取Excel内容并创建Word,主要将涉及以下三个知识点
“openpyxl 读取 Excel 文件python-docx 写入 Word 文件python-docx 各类样式的设计和调整”
你是公司的底层小虾米,前段时间收集了公司各个部门的请假信息汇总表如下:
现在你需要根据表格中每个人的信息依次生成各自的请假条如下:
需求的特殊性在于没有现成的模板,因此需要在代码中同时完成模板的制作和文字、段落样式设计。
比较复杂的文字版面更建议直接设计好模板,以及确定好程序识别位置的定位符,详细内容可以参考之前的教程:批量生成合同
整个需求的实现逻辑很简单,主要分为以下 2 步:
“
获取 Excel 文件中每一行的信息,提取 5 个参数;结合获取的参数设计请假条样式并输出
”
逻辑并不困难,但是复杂的地方在于用代码输出请假条的过程,包括加粗、字号、下划线等等。
需求中的请假信息汇总表为 Leave.xlsx,已放链接供练习下载 首先读取请假信息表,尝试获取除表头外实际信息的 5 个参数:
from openpyxl import load_workbook
path = r'C:xxx' # 路径为Excel 文件所在的位置,可按实际情况更改
workbook = load_workbook(path + r'Leave.xlsx')
sheet = workbook.active
n = 0 for row in sheet.rows:
if n:
for cell in row:
print(cell.value)
n += 1
通过 for row in sheet.rows 和 for cell in row 就可以迭代 Excel 中有数据的每个单元格了。
循环体中加上对 n 的判断是为了跳过表头 如果让输出更加直观可以稍微修改上面的代码:
n = 0 for row in sheet.rows:
if n:
for cell in row:
print(cell.value, end=', ')
print('')
n += 1
信息已经获取到了,但我们也发现申请日期是 datetime 形式,因此我们需要利用 datetime 库获取其中的日期成分,也可以转化为字符串后利用空格切片:
n = 0 for row in sheet.rows:
if n:
name = row[0].value department = row[1].value
reason = row[2].value days = row[3].value
date = str(row[4].value).split()[0]
print(name, department, reason, days, date)
n += 1
提取到信息后就可以在循环体内建立个“请假条函数”,即把每条记录的 5 个变量传入函数,在函数中生成完整请假条并保存,即修改成如下形式:
def request_for_leave(name, department, reason, days, date):
pass
n = 0 for row in sheet.rows:
if n:
name = row[0].value department = row[1].value
reason = row[2].value days = row[3].value date = str(row[4].value).split()[0]
request_for_leave(name, department, reason, days, date)
n += 1
生成请假条中,首先导入依赖的库 python-docx 以及跟样式设置有关的相应方法:
# 读取 Word 文件 from docx import Document # 文件涉及段落样式修改 from docx.enum.text
import WD_PARAGRAPH_ALIGNMENT # 文件涉及文字样式修改:颜色修改、字号调整 from docx.shared
import RGBColor, Pt # 设置中文字体 from docx.oxml.ns import qn
接下来就是依次添加各部分的内容和样式,因为全文的字体均为楷体,可以在函数体的最末尾一并修改。首先实例化文件后添加“请假条”:
def request_for_leave(name, department, reason, days, date): doc = Document()
heading_1 = '请 假 条' paragraph_1 = doc.add_heading(heading_1, level=1)
# 居中对齐 paragraph_1.alignment = WD_PARAGRAPH_ALIGNMENT.CENTER
# 标题要打,单独修改较大字号 for run in paragraph_1.runs:
run.font.size = Pt(17)
如果对上面的代码单独输出会发现标题颜色是蓝色,这是以 .add_heading() 添加标题默认的颜色。
最后也可以统一修改 对于“尊敬的领导:”这一行基本同理,但不需要修改字号:
greeting_word = '尊敬的领导:' paragraph_2 = doc.add_paragraph(greeting_word)
接下来是核心请假条的正文了,从需求中的样式上可以看出,整句话中有一些文字块是固定的,包括 “本人” “、所在部门” “,由于” “需请假” “天。”,而几个文字块之间的信息是根据不同人的情况而不同,并且需要添加下划线。
简单的逻辑就是将参数对应的文字块添加好下划线之后,和固有不变的变量进行拼接,就可以形成完整的段落了:
word_1 = " 本人" word_2 = ",所在部门" word_3 = ",由于"
word_4 = ",需请假" word_5 = "天。" paragraph_3 = doc.add_paragraph()
paragraph_3.add_run(word_1)
paragraph_3.add_run(name).underline = True paragraph_3.add_run(word_2)
paragraph_3.add_run(department).underline = True paragraph_3.add_run(word_3)
paragraph_3.add_run(reason).underline = True paragraph_3.add_run(word_4)
paragraph_3.add_run(str(days)).underline = True paragraph_3.add_run(word_5)
# 设置下划线 paragraph_3.paragraph_format.line_spacing = 1.5
代码中 .underline = True 就是对参数对应的文字块添加下划线 接下来的申请人和日期填写就和上面基本类似。
比较大的区别在于添加了一行新的命令 paragraph.alignment =
WD_PARAGRAPH_ALIGNMENT.RIGHT, 这行命令能够将这两个段落右对齐:
word_6 = '申请人:' paragraph_4 = doc.add_paragraph()
paragraph_4.add_run(word_6)
paragraph_4.add_run(name).underline = True
paragraph_4.alignment = WD_PARAGRAPH_ALIGNMENT.RIGHT
word_7 = '日期:' sign_date = "{}年{}月{}日".format(date.split('-')[0],
date.split('-')[1], date.split('-')[2])
paragraph_5 = doc.add_paragraph()
paragraph_5.add_run(word_7)
paragraph_5.add_run(sign_date).underline = True
paragraph_5.alignment = WD_PARAGRAPH_ALIGNMENT.RIGHT
最后就是统一修改字体为楷体,中文字体修改比较麻烦,不像英文字体只需要指定如 run.font.name = 'Arial' 就可以,需要额外的几行代码。最后记得保存:
for paragraph in doc.paragraphs:
for run in paragraph.runs:
# 统一修改颜色 run.font.color.rgb = RGBColor(0, 0, 0)
run.font.name = '楷体' r = run._element.rPr.rFonts
r.set(qn('w:eastAsia'), '楷体')
doc.save(path + "{}-请假条.docx".format(name))
运行上述代码即可针对每个人产生相应的请假条:
至此,我们就成功利用Python实现了开头的需求,解放双手。注意本案例同样适用于邀请函、证明等各类文书的制作,大家可以举一反三。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
MySQL 执行计划中 rows 数量的准确性解析:原理、影响因素与优化 在 MySQL SQL 调优中,EXPLAIN执行计划是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 对象的 text 与 content:区别、场景与实践指南 在 Python 进行 HTTP 网络请求开发时(如使用requests ...
2025-09-15CDA 数据分析师:激活表格结构数据价值的核心操盘手 表格结构数据(如 Excel 表格、数据库表)是企业最基础、最核心的数据形态 ...
2025-09-15Python HTTP 请求工具对比:urllib.request 与 requests 的核心差异与选择指南 在 Python 处理 HTTP 请求(如接口调用、数据爬取 ...
2025-09-12解决 pd.read_csv 读取长浮点数据的科学计数法问题 为帮助 Python 数据从业者解决pd.read_csv读取长浮点数据时的科学计数法问题 ...
2025-09-12CDA 数据分析师:业务数据分析步骤的落地者与价值优化者 业务数据分析是企业解决日常运营问题、提升执行效率的核心手段,其价值 ...
2025-09-12用 SQL 验证业务逻辑:从规则拆解到数据把关的实战指南 在业务系统落地过程中,“业务逻辑” 是连接 “需求设计” 与 “用户体验 ...
2025-09-11塔吉特百货孕妇营销案例:数据驱动下的精准零售革命与启示 在零售行业 “流量红利见顶” 的当下,精准营销成为企业突围的核心方 ...
2025-09-11CDA 数据分析师与战略 / 业务数据分析:概念辨析与协同价值 在数据驱动决策的体系中,“战略数据分析”“业务数据分析” 是企业 ...
2025-09-11Excel 数据聚类分析:从操作实践到业务价值挖掘 在数据分析场景中,聚类分析作为 “无监督分组” 的核心工具,能从杂乱数据中挖 ...
2025-09-10统计模型的核心目的:从数据解读到决策支撑的价值导向 统计模型作为数据分析的核心工具,并非简单的 “公式堆砌”,而是围绕特定 ...
2025-09-10CDA 数据分析师:商业数据分析实践的落地者与价值创造者 商业数据分析的价值,最终要在 “实践” 中体现 —— 脱离业务场景的分 ...
2025-09-10机器学习解决实际问题的核心关键:从业务到落地的全流程解析 在人工智能技术落地的浪潮中,机器学习作为核心工具,已广泛应用于 ...
2025-09-09SPSS 编码状态区域中 Unicode 的功能与价值解析 在 SPSS(Statistical Product and Service Solutions,统计产品与服务解决方案 ...
2025-09-09CDA 数据分析师:驾驭商业数据分析流程的核心力量 在商业决策从 “经验驱动” 向 “数据驱动” 转型的过程中,商业数据分析总体 ...
2025-09-09R 语言:数据科学与科研领域的核心工具及优势解析 一、引言 在数据驱动决策的时代,无论是科研人员验证实验假设(如前文中的 T ...
2025-09-08T 检验在假设检验中的应用与实践 一、引言 在科研数据分析、医学实验验证、经济指标对比等领域,常常需要判断 “样本间的差异是 ...
2025-09-08在商业竞争日益激烈的当下,“用数据说话” 已从企业的 “加分项” 变为 “生存必需”。然而,零散的数据分析无法持续为业务赋能 ...
2025-09-08随机森林算法的核心特点:原理、优势与应用解析 在机器学习领域,随机森林(Random Forest)作为集成学习(Ensemble Learning) ...
2025-09-05Excel 区域名定义:从基础到进阶的高效应用指南 在 Excel 数据处理中,频繁引用单元格区域(如A2:A100、B3:D20)不仅容易出错, ...
2025-09-05