python之shutil模块11个常用函数详解-CDA数据分析师官网

热线电话：13121318867

python之shutil模块11个常用函数详解

2020-09-03

作者：小伍哥

来源：AI入门学习

shutil 是篇python 中的高级文件操作模块，与os模块形成互补的关系，os主要提供了文件或文件夹的新建、删除、查看等方法，还提供了对文件以及目录的路径操作。shutil模块提供了移动、复制、压缩、解压等操作，恰好与os互补，共同一起使用，基本能完成所有文件的操作。是一个非常重要的模块。

#加载包

import shutil

#查看包中的所有方法

print(dir(shutil))

[ 'chown', 'collections', 'copy', 'copy2', 'copyfile', 'copyfileobj', 'copymode', 'copystat', 'copytree', 'disk_usage', 'errno', 'fnmatch', 'get_archive_formats', 'get_terminal_size', 'get_unpack_formats', 'getgrnam', 'getpwnam', 'ignore_patterns', 'make_archive', 'move', 'nt', 'os', 'register_archive_format', 'register_unpack_format', 'rmtree', 'stat', 'sys', 'unpack_archive', 'unregister_archive_format', 'unregister_unpack_format', 'which']

01、copy()

描述：复制文件

语法：shutil.copy(fsrc，path)，返回值：返回复制之后的路径

fsrc：源文件
path：目标地址

shutil.copy('test.csv','C:/Users/zhengxiang.wzx/Desktop/')
'C:/Users/zhengxiang.wzx/Desktop/test.csv'

02、copy2()

描述：复制文件和状态信息

语法：shutil.copy(fsrc，path)，返回值：返回复制之后的路径

fsrc：源文件
path：目标地址

shutil.copy2('test.csv','C:/Users/zhengxiang.wzx/Desktop/')
'C:/Users/zhengxiang.wzx/Desktop/test.csv'

03、copyfileobj()

描述：将一个文件的内容拷贝到另一个文件中，如果目标文件本身就有内容，来源文件的内容会把目标文件的内容覆盖掉。如果文件不存在它会自动创建一个。

语法：shutil.copyfileobj(fsrc, fdst[, length=16*1024])

fsrc：源文件
fdst：复制至fdst文件
length：缓冲区大小，即fsrc每次读取的长度

import shutil
f1 = open('file.txt','r')
f2 = open('file_copy.txt','w+')
shutil.copyfileobj(f1,f2,length=16*1024)

04、copyfile()

描述：将一个文件的内容拷贝到另一个文件中，目标文件无需存在

语法：shutil.copyfile(src, dst,follow_symlinks)

src：源文件路径
dst：复制至dst文件，若dst文件不存在，将会生成一个dst文件；若存在将会被覆盖
follow_symlinks：设置为True时，若src为软连接，则当成文件复制；如果设置为False，复制软连接。默认为True。

#file_1不存在，会产生一个
shutil.copyfile('file_0.csv','file_1.csv')
'file_1.csv'
#file_2存在，直接复制
shutil.copyfile('file_0.csv','file_2.csv')
'file_2.csv'

05、copytree()

描述：复制整个目录文件，不需要的文件类型可以不复制

语法：shutil.copytree(oripath, despath, ignore= shutil.ignore_patterns("*.xls", "*.doc"))

参数：

oripath : "来源路径"
despath : "目标路径"
ignore : shutil.ignore_patterns() 是对内容进行忽略筛选，将对应的内容进行忽略。

import shutil,
  ospath1 = os.path.join(os.getcwd(),"kaggle")
path1
'C:\\Users\\wuzhengxiang\\Desktop\\Python知识点总结\\kaggle'
#bbb与ccc文件夹都可以不存在,会自动创建
path2 = os.path.join(os.getcwd(),"bbb","ccc")
path2
'C:\\Users\\wuzhengxiang\\Desktop\\Python知识点总结\\bbb\\ccc'
# 将"abc.txt","bcd.txt"忽略，不复制
shutil.copytree(path1,path2,ignore=shutil.ignore_patterns("abc.txt","bcd.txt"))

06、copymode()

描述：拷贝权限，前提是目标文件存在，不然会报错。将src文件权限复制至dst文件。文件内容，所有者和组不受影响

语法：shutil.copymode(src，dst)

src：源文件路径
dst：将权限复制至dst文件，dst路径必须是真实的路径，并且文件必须存在，否则将会报文件找不到错误
follow_symlinks：设置为False时，src, dst皆为软连接，可以复制软连接权限，如果设置为True，则当成普通文件复制权限。默认为True。Python3新增参数

shutil.copymode("file_0.csv","file_1.csv")

07、move()

描述：移动文件或文件夹

语法：shutil.move(src, dst)

os.chdir('C:/Users/wuzhengxiang/Desktop/Python知识点总结')
os.getcwd()
shutil.move('file_1.csv', 'C:/Users/wuzhengxiang/Desktop/股票数据分析')
'C:/Users/wuzhengxiang/Desktop/股票数据分析\\file_1.csv'

08、disk_usage（）

描述：查看磁盘使用信息，计算磁盘总存储，已用存储，剩余存储信息。

语法：shutil.disk_usage('盘符')

返回值：元组

shutil.disk_usage('D:')
usage(total=151199412224, used=41293144064, free=109906268160)
total，总存储：151199412224/1024/1024/1024=140GB
used，已使用：41293144064/1024/1024/1024=38GB
free，剩余容量：109906268160/1024/1024/1024=102GB

09、 make_archive（）

描述：压缩打包

语法：make_archive(base_name, format, root_dir=None, base_dir=None, verbose=0,dry_run=0, owner=None, group=None, logger=None)

压缩打包

base_name：压缩包的文件名，也可以是压缩包的路径。只是文件名时，则保存至当前目录，否则保存至指定路径
format：压缩或者打包格式 "zip", "tar", "bztar"or "gztar"
root_dir : 将哪个目录或者文件打包（也就是源文件）

#把当前目录下的file_1.csv打包压缩
shutil.make_archive('file_1.csv','gztar',root_dir='C:/Users/wuzhengxiang/Desktop/股票数据分析')
'C:\\Users\\wuzhengxiang\\Desktop\\股票数据分析\\file_1.csv.tar.gz'

09、 get_archive_formats（）

描述： 获取支持的压缩文件格式。目前支持的有：tar、zip、gztar、bztar。在Python3还多支持一种格式xztar

语法：unpack_archive(filename, extract_dir=None, format=None)

filename：文件路径
extract_dir：解压至的文件夹路径。文件夹可以不存在，会自动生成
format：解压格式，默认为None，会根据扩展名自动选择解压格式

import shutil,
  oszip_path = os.path.join(os.getcwd(),"file_1.csv.tar")
extract_dir = os.path.join(os.getcwd(),"aaa")
shutil.unpack_archive(zip_path, extract_dir)

11、rmtree（）

描述：递归的去删除文件

语法：shutil.rmtree(path[, ignore_errors[, onerror]])

#删除文件夹
shutil.rmtree('C:/Users/wuzhengxiang/Desktop/Python知识点总结/test2')

CDA数据分析师考试相关入口一览（建议收藏）：

▷ 想报名CDA认证考试，点击>>> “CDA报名” 了解CDA考试详情；

▷ 想学习CDA考试教材，点击>>> “CDA教材” 了解CDA考试教材；

▷ 想加入CDA考试题库，点击>>> “CDA题库” 了解CDA考试题库；

▷ 想了解CDA考试含金量，点击>>> “CDA含金量” 了解CDA考试详情；

▷ 想了解CDA院校合作，点击>>> “院校合作” 了解咨询CDA院校合作；

压缩数据分析 python

数据分析咨询请扫描二维码

若不方便扫码，搜微信号：CDAshujufenxi

上一篇刷抖音会影响学习吗？相关和因果初探

下一篇python进阶，详解collections工具库！

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

京公网安备 11010802034615号经营许可证编号：京B2-20210330

联系电话：13321103290 (微信同号)

客服在线

立即咨询

客服在线

立即咨询

免密码登录

提交首次登录验证后自动注册

python之shutil模块11个常用函数详解

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

【CDA干货】OSM指标体系：自上而下拆解逻辑、搭建流 ...

【CDA干货】选择统计方法前最重要的核心工作：避免9 ...

从“零散明细”到“多维洞察”：CDA数据分析师视角 ...

【CDA干货】问卷效度高与后续因子分析：逻辑关系、 ...

CDA持证人专访：唐一楠谈应届生数据分析就业与学习 ...

从“静态数据”到“动态资产”：CDA数据分析师视角 ...

【CDA干货】SQL统计月度每日夜间数据：口径定义、多 ...

【CDA干货】特征置换重要性分析：原理、计算流程、 ...

从“单元格”到“字段”：CDA数据分析师视角下的表 ...

CDA持证人专访：张继荣谈销售转岗数据分析的追梦路 ...

【CDA干货】Excel卡方检验实操指南：原理、步骤、结 ...

从“单元格”到“洞察”：CDA数据分析师视角下的表 ...

【CDA干货】Excel透视表数据直接跨单元格相乘：风险 ...

从“行列规范”到“业务洞察”：CDA数据分析师视角 ...

数据分析师就业难不难？薪资待遇如何？考 CDA 证书 ...

CDA 持证人专访：刘燕谈数据分析师业务落地与项目实 ...

【CDA干货】数据清洗核心技术体系：缺失值填充、去 ...

从“数据”到“洞察”：CDA数据分析师视角下的统计 ...

【CDA干货】指标生命周期全链路管理：从规划设计到 ...

【CDA干货】留存运营指标体系：计算口径、分析方法 ...

CDA教育闭环

常见问题

关于我们

CDA数据分析师公众号

CDA考试中心小程序

CDA数据分析师App下载