pandas read_csv（）函数应用

PGC123

2018-10-30 阅读量: 1255

pandas read_csv（）函数都有哪些参数？怎么使用

pandas是种很便捷的数据处理工具，有很多高级的函数让我们高效的利用python做数据分析相关工作。

pandas可以读取多种数据源，常见的一种是csv文件。pandas读取csv文件的函数是read_csv(),名字很好记。

read_csv()函数有许多的参数，官网文档中函数定义如下：

pd.read_csv(filepath_or_buffer, sep=',', delimiter=None, header='infer', names=None, index_col=None, usecols=None, squeeze=False, prefix=None, mangle_dupe_cols=True, dtype=None, engine=None, converters=None, true_values=None, false_values=None, skipinitialspace=False, skiprows=None, nrows=None, na_values=None, keep_default_na=True, na_filter=True, verbose=False, skip_blank_lines=True, parse_dates=False, infer_datetime_format=False, keep_date_col=False, date_parser=None, dayfirst=False, iterator=False, chunksize=None, compression='infer', thousands=None, decimal=b'.', lineterminator=None, quotechar='"', quoting=0, escapechar=None, comment=None, encoding=None, dialect=None, tupleize_cols=None, error_bad_lines=True, warn_bad_lines=True, skipfooter=0, doublequote=True, delim_whitespace=False, low_memory=True, memory_map=False, float_precision=None)

这些参数并不是都常用，常用的参数有如下几个：

filepath_or_buffer：文件路径或者其他可读的对象
sep：数据分割符，csv文件默认是逗号分隔，当然其他符号也是可以的
header：可指定某一行为dataframe的列明
encoding：文件的编码格式，默认utf-8
dtype：读入后的数据类型
engine：解析引擎，默认使用C，但是c对中文支持的不好，如果文件路径中由中文可以将该参数设置为python
chunksize:设置每次读取数据块大小，单位是行，只有在文件很大时才会用到次参数。

0.0000

关注作者

发表评论

暂无数据

CDA考试动态

CDA报考指南

推荐帖子