python的pandas库的pd.read_excel()常用解析

liting李

2021-02-20 阅读量: 1410

pd.read_excel（），函数的官方文档是这么说的：将Excel文件读取到pandas DataFrame中，系统默认支持‘xls’和‘xlsx’后缀的文件名，函数都可以处理，看一下这个函数的所有参数：

io参数

（1）这个参数可以接受的有：字符串str，excel文件，或者路径对象，一般是路径+文件的名字，这是最重要的参数，必须传入：

pd.read_excel(r’F:\data\aa.xlsx’)

sheet_name

这个参数是指定excel表格的第几个sheet表，不指定默认是第一个sheet，对应的值是0，如果需要打开第二个sheet，可以将sheet_name=1，如果你的sheet自定义了名字，则把数字换成你名字即可

在这里插入图片描述

header

这个参数是为了解决是否将前面的表头读入数据表中，如果header = 2，则说明指定位置是2的行作为列名，如果没有设置则说明是所有的数据作为数据，然后另外一行（系统默认输入0-n）作为列名字

index_col

这个参数是默认是None，和header一样，可以填入数字，意思是设置第几列为行索引

dtype

这个参数输入可以表示类型的名称字符或者字典，如果dtype=‘str’，则说明整个表格的书数据都转换成字符串的数据类型，如果输入的是字典，则dtype={‘列1’：‘str’，‘列2’：‘int’}则说明每个字段都可以指定不同的数据类型，上面的定义的意思就是第一列是字符串，第二列是整型

以上是我比较常用的参数，后面还有很多参数，需要的可以自己探索下~

59.2826

关注作者

发表评论

暂无数据

CDA考试动态

CDA报考指南

推荐帖子