京公网安备 11010802034615号
经营许可证编号:京B2-20210330
来源:早起Python
作者:陈熹、刘早起
大家好,又到了Python办公自动化(偷懒)专题。
今天介绍的案例是如何利用Python来自动化移动、修改、重命名文件/夹,这样的操作在日常办公中经常会用到,若能掌握用Python实现将会大大提高效率!
所以我希望能够通过这篇文章来让大家了解:如何基于 os glob 和 shutil 对文件管理的综合运用!
为了让本文介绍的案例更有通用型,我新建了一个文件夹 files1 存放着 1800+ 个文件,如下所示:
需要完成的内容如下
“
将 1835 个文件移动到新文件夹 file2,并且重命名文件,名字开头加上 序号 和 “终稿” 两个字,如名字更改为 “1-终稿-xxxxx(原文件名)”
”
你心里可能想着:这是人做的事??? 但确实这是真实的需求,文件批量重命名非常常见,如果没有一些技巧,那么只能耗费大量的时间和人力去做。这里的技巧,就是 Python
另外还有一个问题:要先移动再重命名还是先重命名再移动呢? 继续往下看!
真实的办公场景并不会这样的需求,毕竟谁想要无端给自己的电脑产生大量无用文件呢(也不要给别人的电脑乱用)
不得不提,生成随机文件能够帮助我们更好的测试自己 Python 文件管理的技能。如果你没有合适的文件夹和文件夹供自己练习,那么为什么不自己写个代码产生呢?
当然,在这个过程中我们也会学习一些知识点,先看代码:
import random import string for i in range(2000):
random_str = ''.join(random.sample(string.ascii_letters + string.digits, random.randint(1, 11)))
file = open(r"C:\xxx\file1" + random_str + ".txt", 'w+') # 前面路径是产生文件的目标文件夹
file.write(''.join(random.sample(string.ascii_letters + string.digits, random.randint(1, 11))))
file.close()
通过 string 就可以获得所有的字母和数字,利用 random.sample() 常规接受两个参数,一个是抽样的范围,一个是抽样的次数,默认是放回抽样。这样就可以在给定的字母数字范围内随机抽取 1-10 个,但是返回的结果注意是列表,需要再用 .join 方法完成字符串拼接
用随机产生的名字生成文件后,再在其内部用类似的方法随机写入一些内容:
上面的写法不够优雅,因为需要配套使用 file.close() 释放,更好的方法是直接利用上下文管理器 with 结构,减少出错的几率
import random import string for i in range(2000):
random_str = ''.join(random.sample(string.ascii_letters + string.digits, random.randint(1, 11)))
with open(r"C:\xxx\file1" + random_str + ".txt", 'w+') as file:
file.write(''.join(random.sample(string.ascii_letters + string.digits, random.randint(1, 11))))
因为即使是随机产生名字,但抽样的范围和次数不大决定了 2000 次抽样会有一些抽签组合成的名字完全一样,后面形成的文件会覆盖之前产生的文件,最终导致产生的文件没有 2000 个。
需要用到内置库 os 的 os.rename() 方法
import os os.rename('practice.txt', 'practice_rename.txt') # 重命名文件 os.rename('文件夹1', '文件夹2') # 重命名文件夹
虽然需求中有重命名文件的需求,但实际上并不需要直接借助这个方法
需要用到内置库 shutil 的 shutil.move 方法
import shutil
shutil.move(r'.practice.txt', r'.文件夹1/')
shutil.move(r'.practice.txt', r'.文件夹1/new.txt')
注意到上面后两行代码的区别吗?前一行是将目标文件移动到目标文件夹里,而后一行,在将目标文件移动到目标文件夹里的同时,能够对其进行重命名
也就是说,我们并不需要用 os.rename 先命名文件再用 shutil.move 将其移动的指定文件夹,而是可以用 shutil.move 一步到位。
采用基于 glob 库的迭代框架:
import glob
path = xxx for file in glob.glob(f'{path}/**/*.xlsx', recursive=True):
pass
上面的代码能够获取给定路径内部所有文件夹下的 Excel 文件(.xlsx 格式), recursive 参数默认为 False,当为 True 时允许逐级遍历
而本例需要获取给定文件夹下的所有 .txt 文件,则更加简单:
import glob
path = xxx for file in glob.glob(f'{path}/*.txt'):
pass
在上面一节我们已经把需求拆分为多个小块并理清了思路,现在可以开始写代码了。首先导入需要的库
import os import shutil import glob
path = r"C:xxx" # 存放大量需更名移动文件的文件夹路径的上一级路径
上文提到,不需要利用 os.rename 那为什么要导入 os 库呢?
一方面因为要通过这个库产生新的文件夹。也可以手动完成,但交给代码多了判断也不容易出错:
if not os.path.exists(path + r'file2'):
os.mkdir(path + r'file2')
另一方面下文还会用它获取文件名,然后就可以移动更名一步到位,glob 迭代文件框架遍历获取文件绝对路径:
count = 1 # 生成序号 for file in glob.glob(f'{path}\测试\*.txt'):
# 这里是文件绝对路径,可以用字符串方法直接替换修改,但为了方便理解我还是用路径拼接 filename = os.path.basename(file)
shutil.move(file, path + r'file2' + f'{count}-终稿-{filename}')
count += 1
看到没,Python、3秒、搞定、干饭!
CDA学员免费下载查看报告全文:2026全球数智化人才指数报告【CDA数据科学研究院】.pdf
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数字化时代,商业竞争的核心已从“经验驱动”转向“数据驱动”,越来越多的企业意识到,商业分析不是简单的数据统计与报表呈现 ...
2026-05-06在Excel数据透视表的实操中,“引用”是连接透视表与公式、辅助数据的核心操作,而相对引用作为最基础、最常用的引用方式,其设 ...
2026-05-06 很多数据分析师做过按月份的销售额趋势图,画过按天的流量折线图,但当被问到“时间序列和普通数据有什么本质区别”“季节性 ...
2026-05-06在Excel数据分析中,数据透视表是汇总、整理海量数据的高效工具,而公式则是实现数据二次计算、逻辑判断的核心功能。实际操作中 ...
2026-04-30Excel透视图是数据分析中不可或缺的工具,它能将透视表中的数据快速可视化,帮助我们直观捕捉数据规律、呈现分析结果。但在实际 ...
2026-04-30 很多数据分析师能熟练地计算指标、搭建标签体系,但当被问到“画像到底在解决什么问题”“画像和标签是什么关系”“画像如何 ...
2026-04-30在中介效应分析中,人口统计学变量(如年龄、性别、学历、收入、职业等)是常见的控制变量或调节变量,其处理方式直接影响分析结 ...
2026-04-29在SQL数据库实操中,日期数据的存储与显示是高频需求,而“数字日期”(如20240520、20241231、45321)是很多开发者、数据分析师 ...
2026-04-29 很多分析师在设计标签时思路清晰,但真到落地环节却面临“数据在手,不知如何转化为可用标签”的困境:或因加工方式选择不当 ...
2026-04-29在手游行业竞争日趋白热化的当下,“流量为王”早已升级为“留存为王”,而付费用户留存率更是衡量一款手游盈利能力、运营质量的 ...
2026-04-28在日常MySQL数据库运维与开发中,经常会遇到“同一台服务器上,两个不同数据库(以下简称“源库”“目标库”)的表数据需要保持 ...
2026-04-28 很多分析师每天和数据打交道,但当被问到“标签是什么”“标签和指标有什么区别”“标签体系如何设计”时,却常常答不上来。 ...
2026-04-28箱线图(Box Plot)作为一种经典的数据可视化工具,广泛应用于统计学、数据分析、科研实证等领域,核心价值在于直观呈现数据的集 ...
2026-04-27实证分析是社会科学、自然科学、经济管理等领域开展研究的核心范式,其核心逻辑是通过对多维度数据的收集、分析与解读,揭示变量 ...
2026-04-27 很多数据分析师精通Excel函数和数据透视表,但当被问到“数据从哪里来”“表和视图有什么区别”“数据库管理系统和SQL是什么 ...
2026-04-27在大数据技术飞速迭代、数字营销竞争日趋激烈的今天,“精准触达、高效转化、成本可控”已成为企业营销的核心诉求。传统广告投放 ...
2026-04-24在游戏行业竞争白热化的当下,用户流失已成为制约游戏生命周期、影响营收增长的核心痛点。据行业报告显示,2024年移动游戏平均次 ...
2026-04-24 很多业务负责人开会常说“我们要数据驱动”,最后却变成“看哪张报表数据多就用哪个”,往往因为缺乏一套结构性的方法去搭建 ...
2026-04-24在Power BI数据可视化分析中,切片器是连接用户与数据的核心交互工具,其核心价值在于帮助使用者快速筛选目标数据、聚焦分析重点 ...
2026-04-23以数为据,以析促优——数据分析结果指导临床技术改进的实践路径 临床技术是医疗服务的核心载体,其水平直接决定患者诊疗效果、 ...
2026-04-23