热线电话:13121318867

登录
2018-10-30 阅读量: 927
pandas read_csv()函数应用

pandas read_csv()函数都有哪些参数?怎么使用

pandas是种很便捷的数据处理工具,有很多高级的函数让我们高效的利用python做数据分析相关工作。

pandas可以读取多种数据源,常见的一种是csv文件。pandas读取csv文件的函数是read_csv(),名字很好记。

read_csv()函数有许多的参数,官网文档中函数定义如下:

pd.read_csv(filepath_or_buffer, sep=',', delimiter=None, header='infer', names=None, index_col=None, usecols=None, squeeze=False, prefix=None, mangle_dupe_cols=True, dtype=None, engine=None, converters=None, true_values=None, false_values=None, skipinitialspace=False, skiprows=None, nrows=None, na_values=None, keep_default_na=True, na_filter=True, verbose=False, skip_blank_lines=True, parse_dates=False, infer_datetime_format=False, keep_date_col=False, date_parser=None, dayfirst=False, iterator=False, chunksize=None, compression='infer', thousands=None, decimal=b'.', lineterminator=None, quotechar='"', quoting=0, escapechar=None, comment=None, encoding=None, dialect=None, tupleize_cols=None, error_bad_lines=True, warn_bad_lines=True, skipfooter=0, doublequote=True, delim_whitespace=False, low_memory=True, memory_map=False, float_precision=None)

这些参数并不是都常用,常用的参数有如下几个:

filepath_or_buffer:文件路径或者其他可读的对象
sep:数据分割符,csv文件默认是逗号分隔,当然其他符号也是可以的
header:可指定某一行为dataframe的列明
encoding:文件的编码格式,默认utf-8
dtype:读入后的数据类型
engine:解析引擎,默认使用C,但是c对中文支持的不好,如果文件路径中由中文可以将该参数设置为python
chunksize:设置每次读取数据块大小,单位是行,只有在文件很大时才会用到次参数。

0.0000
2
关注作者
收藏
评论(0)

发表评论

暂无数据
推荐帖子