在 Pandas 中,NaN 表示空或缺失值。在数据分析中,经常需要计算 DataFrame 中每列的 NaN 值出现的次数。本文将介绍如何使用 Pandas 计算 DataFrame 中每列的 NaN 值出现的次数。
Pandas 是一个开源数据分析工具。它提供了一个称为“DataFrame”的数据结构,该结构类似于电子表格,可以用来存储和操作二维数据。在 Pandas DataFrame 中,NaN 表示空或缺失值。在实际的数据分析中,会经常遇到缺失值的情况,因此我们需要计算 DataFrame 中每列的 NaN 值出现的次数。
计算 DataFrame 中每列的 NaN 值数量非常简单。我们只需要使用 isna()
方法检测 DataFrame 中的 NaN 值,并使用 sum()
方法计算每列中 NaN 值的数量。以下是示例代码:
import pandas as pd
df = pd.DataFrame({'A': [1, 2, np.nan],
'B': [4, np.nan, np.nan],
'C': [7, 8, 9]})
print(df.isna().sum())
上面的代码将创建一个包含三列的 Pandas DataFrame。然后使用 isna()
方法检查 DataFrame 中的 NaN 值,并使用 sum()
方法计算每列的 NaN 值的数量。输出结果如下:
A 1
B 2
C 0
dtype: int64
从输出结果可以看出,DataFrame 中的 NaN 值数量分别为 1、2 和 0。
如果需要计算每行的 NaN 值数量,可以使用 sum()
方法并设置 axis
参数为 1。以下是示例代码:
import pandas as pd
df = pd.DataFrame({'A': [1, 2, np.nan],
'B': [4, np.nan, np.nan],
'C': [7, 8, 9]})
print(df.isna().sum(axis=1))
上面的代码将创建一个包含三列的 Pandas DataFrame。然后使用 isna()
方法检查 DataFrame 中的 NaN 值,并使用 sum()
方法计算每行的 NaN 值的数量。输出结果如下:
0 0
1 2
2 0
dtype: int64
从输出结果可以看出,DataFrame 中的每行的 NaN 值数量分别为 0、2 和 0。
在 Pandas 中计算 DataFrame 中每列或每行的 NaN 值数量非常简单。只需要使用 isna()
方法检查 DataFrame 中的 NaN 值,并使用 sum()
方法计算每列或每行的 NaN 值的数量。此外,还可以使用 dropna()
方法删除 DataFrame 中包含 NaN 值的行或列。掌握这些技巧可以使数据分析更加高效。
数据分析咨询请扫描二维码