段‘continent’含‘NA’值，为什么导入数据后没有出现缺失值？

詹惠儿

2020-05-21 阅读量: 911

问：

字段‘continent’含‘NA’值，为什么导入数据后没有出现缺失值？

答：

这是因为导入数据时，设置了keep_default_na=False，我们在使用pandas读取文件时，常会遇到某个字段为NaN。

一般情况下，这是因为文件中包含空值导致的，因为pandas默认会将 '-1.#IND', '1.#QNAN', '1.#IND', '-1.#QNAN',

'#N/A N/A','#N/A', 'N/A', 'NA', '#NA', 'NULL', 'NaN', '-NaN', 'nan', '-nan', ''
判定为缺失值，从而转换为NaN。如果要避免DATa Frame中出现NaN可以通过keep_default_na参数来解决。

keep_default_na参数用来控制是否要将被判定的缺失值转换为NaN这一过程，默认为True。

当keep_default_na=False时，源文件中出现的什么值，DataFrame中就是什么值。

33.5251

关注作者

发表评论

暂无数据

CDA考试动态

CDA报考指南

推荐帖子