Python是一种用于数据分析的优秀语言,主要是因为以数据为中心的python包的奇妙生态系统。Pandas是其中一个软件包,可以更轻松地导入和分析数据。
import pandas:
将pandas导入为pd
代码#1:read_csv是一个重要的pandas函数,用于读取csv文件并对其执行操作。
# Import pandas
import pandas as pd
# reading csv file
pd.read_csv("filename.csv")
通过此方式打开CSV文件非常简单。但是,通过此函数可以执行许多其他操作,只能完全更改返回的对象。例如,人们不仅可以在本地读取csv文件,而且可以通过read_csv读取URL,也可以选择导出所需的列,以便以后不必编辑数组。
以下是其默认值所采用的参数列表。
pd.read_csv(filepath_or_buffer,sep =',',delimiter = None,header ='infer',names = None,index_col = None,usecols = None,squeeze = False,prefix = None,mangle_dupe_cols = True,dtype = None,engine = None, converters = None,true_values = None,false_values = None,skipinitialspace = False,skiprows = None,nrows = None,na_values = None,keep_default_na = True,na_filter = True,verbose = False,skip_blank_lines = True,parse_dates = False,infer_datetime_format = False,keep_date_col = False,date_parser = None,dayfirst = False,iterator = False,chunksize = None,lineterminator =无,quotechar ='“',引用= 0,escapechar = None,comment = None,encoding = None,dialect = None,tupleize_cols = None,error_bad_lines = True,warn_bad_lines = True,skipfooter = 0,doublequote = True,delim_whitespace = False,low_memory = True,memory_map = False ,float_precision =None)
并非所有这些都非常重要,但记住这些实际上节省了自己执行相同功能的时间。通过在jupyter笔记本中按shift + tab可以看到任何功能的参数








暂无数据