2018-12-19
阅读量:
802
检测缺失值
由于数据有许多形状和形式,因此pandas的目标是在处理缺失数据时保持灵活性。虽然NaN
是计算速度和便利性的默认缺失值标记,但我们需要能够使用不同类型的数据轻松检测此值:浮点,整数,布尔值和一般对象。然而,在许多情况下,Python中的None
会出现,我们也希望考虑“丢失”或“不可用”或“不适用。
如果在计算中考虑inf
并且-inf
是“NA”,你可以设置。pandas.options.mode.use_inf_as_na=True。
pandas提供isna()和notna()功能,这也是对系列的方法和数据帧的对象:
In [7]: df2['one']
Out[7]:
a -0.166778
b NaN
c -0.337890
d NaN
e 0.057802
f -0.443160
g NaN
h -0.717852
Name: one, dtype: float64
In [8]: pd.isna(df2['one'])
Out[8]:
a False
b True
c False
d True
e False
f False
g True
h False
Name: one, dtype: bool
In [9]: df2['four'].notna()
Out[9]:
a True
b False
c True
d False
e True
f True
g False
h True
Name: four, dtype: bool
In [10]: df2.isna()
Out[10]:
one two three four five
a False False False False False
b True True True True True
c False False False False False
d True True True True True
e False False False False False
f False False False False False
g True True True True True
h False False False False False






评论(0)


暂无数据
推荐帖子
0条评论
0条评论
0条评论