2020-05-21
阅读量:
672
段‘continent’含‘NA’值,为什么导入数据后没有出现缺失值?
问:
字段‘continent’含‘NA’值,为什么导入数据后没有出现缺失值?

答:
这是因为导入数据时,设置了keep_default_na=False,我们在使用pandas读取文件时,常会遇到某个字段为NaN。
一般情况下,这是因为文件中包含空值导致的,因为pandas默认会将 '-1.#IND', '1.#QNAN', '1.#IND', '-1.#QNAN',
'#N/A N/A','#N/A', 'N/A', 'NA', '#NA', 'NULL', 'NaN', '-NaN', 'nan', '-nan', ''
判定为缺失值,从而转换为NaN。如果要避免DATa Frame中出现NaN可以通过keep_default_na参数来解决。
keep_default_na参数用来控制是否要将被判定的缺失值转换为NaN这一过程,默认为True。
当keep_default_na=False时,源文件中出现的什么值,DataFrame中就是什么值。






评论(0)


暂无数据
推荐帖子
0条评论
0条评论
3条评论