PhilipLiang

2020-06-03   阅读量: 1435

Python数据分析 Python编程

numpy的loadtxt()方法--笔记

扫码加入数据分析学习群

numpy.loadtxt()方法的参数有以下这些:

fname: 指定需要读取的文件地址即可完成最简单的读取操作,如下:

创建一个txt文件(test.txt),文件内容是:

使用numpy.loadtxt()读取,此时使用文件的相对地址进行读取:

考虑到loadtxt()中的dtype参数默认设置为float,这里设置为str字符串便于显示,dtype参数指定读取后的数据类型

comments: comments参数指定读取中,跳过以comments参数开头的行,如:类似linux系统的配置文件中用于说明的行,一般用“#”开头,我们就可以用comments参数进行跳过。

建立一个TXT文件test.txt,内容如下:

使用numpy进行读取结果为:

delimiter: 该参数类似于python处理字符串分割中的split()函数,对数据根据参数进行分割处理。例如fname参数中的文件test.txt,文件默认是以逗号分隔数据,在查看文件时没有显示,当没有使用delimiter参数进行分割时,默认是将整个数据一起输出,当使用delimiter参数时:

结果将数据分行输出了

converters: 该参数是将某一列的数据进行函数预处理再获取,格式为:{列号:函数},可以看成一个字典形式,对列上的所有数据进行函数处理

具体过程如下:

先定义一个函数

使用converters参数操作文件结果为:

skiprows: 指定读取时忽略的行数,默认从首行开始计数,也就是说,当我们设置skiprows=1时,列名就会被跳过不读取,这个参数经常被这样使用:

usecols: usecols参数指定我们需要使用的列,用于提取文件中我们使用的数据,也就是说,平时中我们可能不需要index序列之类的,只要values这一列的数据,如下设置, 文件的列号是从0开始计数,所以我们在这里将参数设置为1,结果为:

unpack: 选择是否将数据向量输出,默认是False,即将数据逐行输出,当设置为True时,数据将逐列输出, 结果为:

encoding: 这个参数是决定读取文件时使用的编码方式,也就是对文件编码方式进行更改,python经常有编码方面的问题出现, 一般注意一下是否为utf-8或者ASCII即可。

添加CDA认证专家【维克多阿涛】,微信号:【cdashijiazhuang】,提供数据分析指导及CDA考试秘籍。已助千人通过CDA数字化人才认证。欢迎交流,共同成长!
18.2071 6 3 关注作者 收藏

评论(0)


暂无数据

推荐课程

推荐帖子