PGC123

2018-10-30   阅读量: 699

数据分析师 Python数据分析 Python编程

pandas read_csv()函数应用

扫码加入数据分析学习群

pandas read_csv()函数都有哪些参数?怎么使用

pandas是种很便捷的数据处理工具,有很多高级的函数让我们高效的利用python做数据分析相关工作。

pandas可以读取多种数据源,常见的一种是csv文件。pandas读取csv文件的函数是read_csv(),名字很好记。

read_csv()函数有许多的参数,官网文档中函数定义如下:

pd.read_csv(filepath_or_buffer, sep=',', delimiter=None, header='infer', names=None, index_col=None, usecols=None, squeeze=False, prefix=None, mangle_dupe_cols=True, dtype=None, engine=None, converters=None, true_values=None, false_values=None, skipinitialspace=False, skiprows=None, nrows=None, na_values=None, keep_default_na=True, na_filter=True, verbose=False, skip_blank_lines=True, parse_dates=False, infer_datetime_format=False, keep_date_col=False, date_parser=None, dayfirst=False, iterator=False, chunksize=None, compression='infer', thousands=None, decimal=b'.', lineterminator=None, quotechar='"', quoting=0, escapechar=None, comment=None, encoding=None, dialect=None, tupleize_cols=None, error_bad_lines=True, warn_bad_lines=True, skipfooter=0, doublequote=True, delim_whitespace=False, low_memory=True, memory_map=False, float_precision=None)

这些参数并不是都常用,常用的参数有如下几个:

filepath_or_buffer:文件路径或者其他可读的对象
sep:数据分割符,csv文件默认是逗号分隔,当然其他符号也是可以的
header:可指定某一行为dataframe的列明
encoding:文件的编码格式,默认utf-8
dtype:读入后的数据类型
engine:解析引擎,默认使用C,但是c对中文支持的不好,如果文件路径中由中文可以将该参数设置为python
chunksize:设置每次读取数据块大小,单位是行,只有在文件很大时才会用到次参数。

添加CDA认证专家【维克多阿涛】,微信号:【cdashijiazhuang】,提供数据分析指导及CDA考试秘籍。已助千人通过CDA数字化人才认证。欢迎交流,共同成长!
0.0000 0 2 关注作者 收藏

评论(0)


暂无数据

推荐课程

推荐帖子