热线电话:13121318867

登录
2019-07-04 阅读量: 750
检测缺失值

由于数据有许多形状和形式,因此pandas的目标是在处理缺失数据时保持灵活性。虽然NaN是计算速度和便利性的默认缺失值标记,但我们需要能够使用不同类型的数据轻松检测此值:浮点,整数,布尔值和一般对象。然而,在许多情况下,Python中的None会出现,我们也希望考虑“丢失”或“不可用”或“不适用。

如果在计算中考虑inf并且-inf是“NA”,你可以设置。pandas.options.mode.use_inf_as_na=True。

pandas提供isna()和notna()功能,这也是对系列的方法和数据帧的对象:

In [7]: df2['one']

Out[7]:

a -0.166778

b NaN

c -0.337890

d NaN

e 0.057802

f -0.443160

g NaN

h -0.717852

Name: one, dtype: float64

In [8]: pd.isna(df2['one'])

Out[8]:

a False

b True

c False

d True

e False

f False

g True

h False

Name: one, dtype: bool

In [9]: df2['four'].notna()

Out[9]:

a True

b False

c True

d False

e True

f True

g False

h True

Name: four, dtype: bool

In [10]: df2.isna()

Out[10]:

one two three four five

a False False False False False

b True True True True True

c False False False False False

d True True True True True

e False False False False False

f False False False False False

g True True True True True

h False False False False False

0.0000
1
关注作者
收藏
评论(0)

发表评论

暂无数据