热线电话:13121318867

登录
2018-12-19 阅读量: 802
检测缺失值

由于数据有许多形状和形式,因此pandas的目标是在处理缺失数据时保持灵活性。虽然NaN是计算速度和便利性的默认缺失值标记,但我们需要能够使用不同类型的数据轻松检测此值:浮点,整数,布尔值和一般对象。然而,在许多情况下,Python中的None会出现,我们也希望考虑“丢失”或“不可用”或“不适用。

如果在计算中考虑inf并且-inf是“NA”,你可以设置。pandas.options.mode.use_inf_as_na=True。

pandas提供isna()和notna()功能,这也是对系列的方法和数据帧的对象:

In [7]: df2['one']
Out[7]:
a -0.166778
b NaN
c -0.337890
d NaN
e 0.057802
f -0.443160
g NaN
h -0.717852
Name: one, dtype: float64

In [8]: pd.isna(df2['one'])
Out[8]:
a False
b True
c False
d True
e False
f False
g True
h False
Name: one, dtype: bool

In [9]: df2['four'].notna()
Out[9]:
a True
b False
c True
d False
e True
f True
g False
h True
Name: four, dtype: bool

In [10]: df2.isna()
Out[10]:
one two three four five
a False False False False False
b True True True True True
c False False False False False
d True True True True True
e False False False False False
f False False False False False
g True True True True True
h False False False False False
0.0000
0
关注作者
收藏
评论(0)

发表评论

暂无数据
推荐帖子