登录
首页大数据时代如何计算 Pandas Dataframe 列中的 NaN 出现的次数?
如何计算 Pandas Dataframe 列中的 NaN 出现的次数?
2023-04-28
收藏

在 Pandas 中,NaN 表示空或缺失值。在数据分析中,经常需要计算 DataFrame 中每列的 NaN 值出现的次数。本文将介绍如何使用 Pandas 计算 DataFrame 中每列的 NaN 值出现的次数。

了解 Pandas DataFrame 中的 NaN 值

Pandas 是一个开源数据分析工具。它提供了一个称为“DataFrame”的数据结构,该结构类似于电子表格,可以用来存储和操作二维数据。在 Pandas DataFrame 中,NaN 表示空或缺失值。在实际的数据分析中,会经常遇到缺失值的情况,因此我们需要计算 DataFrame 中每列的 NaN 值出现的次数。

计算 DataFrame 中每列的 NaN 值数量

计算 DataFrame 中每列的 NaN 值数量非常简单。我们只需要使用 isna() 方法检测 DataFrame 中的 NaN 值,并使用 sum() 方法计算每列中 NaN 值的数量。以下是示例代码:

import pandas as pd

df = pd.DataFrame({'A': [1, 2, np.nan],
                   'B': [4, np.nan, np.nan],
                   'C': [7, 8, 9]})

print(df.isna().sum())

上面的代码将创建一个包含三列的 Pandas DataFrame。然后使用 isna() 方法检查 DataFrame 中的 NaN 值,并使用 sum() 方法计算每列的 NaN 值的数量。输出结果如下:

A    1
B    2
C    0
dtype: int64

从输出结果可以看出,DataFrame 中的 NaN 值数量分别为 1、2 和 0。

计算 DataFrame 中每行的 NaN 值数量

如果需要计算每行的 NaN 值数量,可以使用 sum() 方法并设置 axis 参数为 1。以下是示例代码:

import pandas as pd

df = pd.DataFrame({'A': [1, 2, np.nan],
                   'B': [4, np.nan, np.nan],
                   'C': [7, 8, 9]})

print(df.isna().sum(axis=1))

上面的代码将创建一个包含三列的 Pandas DataFrame。然后使用 isna() 方法检查 DataFrame 中的 NaN 值,并使用 sum() 方法计算每行的 NaN 值的数量。输出结果如下:

0    0
1    2
2    0
dtype: int64

从输出结果可以看出,DataFrame 中的每行的 NaN 值数量分别为 0、2 和 0。

总结

在 Pandas 中计算 DataFrame 中每列或每行的 NaN 值数量非常简单。只需要使用 isna() 方法检查 DataFrame 中的 NaN 值,并使用 sum() 方法计算每列或每行的 NaN 值的数量。此外,还可以使用 dropna() 方法删除 DataFrame 中包含 NaN 值的行或列。掌握这些技巧可以使数据分析更加高效。

数据分析咨询请扫描二维码

客服在线
立即咨询