liting李

2021-02-20   阅读量: 450

Python

python的pandas库的pd.read_excel()常用解析

扫码加入数据分析学习群

pd.read_excel(),函数的官方文档是这么说的:将Excel文件读取到pandas DataFrame中,系统默认支持‘xls’和‘xlsx’后缀的文件名,函数都可以处理,看一下这个函数的所有参数:

image.png

io参数

(1)这个参数可以接受的有:字符串str,excel文件,或者路径对象,一般是路径+文件的名字,这是最重要的参数,必须传入:

pd.read_excel(r’F:\data\aa.xlsx’)


sheet_name

这个参数是指定excel表格的第几个sheet表,不指定默认是第一个sheet,对应的值是0,如果需要打开第二个sheet,可以将sheet_name=1,如果你的sheet自定义了名字,则把数字换成你名字即可

在这里插入图片描述


header

这个参数是为了解决是否将前面的表头读入数据表中,如果header = 2,则说明指定位置是2的行作为列名,如果没有设置则说明是所有的数据作为数据,然后另外一行(系统默认输入0-n)作为列名字


index_col

这个参数是默认是None,和header一样,可以填入数字,意思是设置第几列为行索引


dtype

这个参数输入可以表示类型的名称字符或者字典,如果dtype=‘str’,则说明整个表格的书数据都转换成字符串的数据类型,如果输入的是字典,则dtype={‘列1’:‘str’,‘列2’:‘int’}则说明每个字段都可以指定不同的数据类型,上面的定义的意思就是第一列是字符串,第二列是整型


以上是我比较常用的参数,后面还有很多参数,需要的可以自己探索下~



添加CDA认证专家【维克多阿涛】,微信号:【cdashijiazhuang】,提供数据分析指导及CDA考试秘籍。已助千人通过CDA数字化人才认证。欢迎交流,共同成长!
59.2826 1 0 关注作者 收藏

评论(0)


暂无数据

推荐课程

推荐帖子