如何计算 Pandas Dataframe 列中的 NaN 出现的次数？-CDA数据分析师官网

热线电话：13121318867

首页大数据时代如何计算 Pandas Dataframe 列中的 NaN 出现的次数？

如何计算 Pandas Dataframe 列中的 NaN 出现的次数？

2023-04-28

在 Pandas 中，NaN 表示空或缺失值。在数据分析中，经常需要计算 DataFrame 中每列的 NaN 值出现的次数。本文将介绍如何使用 Pandas 计算 DataFrame 中每列的 NaN 值出现的次数。

了解 Pandas DataFrame 中的 NaN 值

Pandas 是一个开源数据分析工具。它提供了一个称为“DataFrame”的数据结构，该结构类似于电子表格，可以用来存储和操作二维数据。在 Pandas DataFrame 中，NaN 表示空或缺失值。在实际的数据分析中，会经常遇到缺失值的情况，因此我们需要计算 DataFrame 中每列的 NaN 值出现的次数。

计算 DataFrame 中每列的 NaN 值数量

计算 DataFrame 中每列的 NaN 值数量非常简单。我们只需要使用 isna() 方法检测 DataFrame 中的 NaN 值，并使用 sum() 方法计算每列中 NaN 值的数量。以下是示例代码：

import pandas as pd

df = pd.DataFrame({'A': [1, 2, np.nan],
                   'B': [4, np.nan, np.nan],
                   'C': [7, 8, 9]})

print(df.isna().sum())

上面的代码将创建一个包含三列的 Pandas DataFrame。然后使用 isna() 方法检查 DataFrame 中的 NaN 值，并使用 sum() 方法计算每列的 NaN 值的数量。输出结果如下：

A    1
B    2
C    0
dtype: int64

从输出结果可以看出，DataFrame 中的 NaN 值数量分别为 1、2 和 0。

计算 DataFrame 中每行的 NaN 值数量

如果需要计算每行的 NaN 值数量，可以使用 sum() 方法并设置 axis 参数为 1。以下是示例代码：

import pandas as pd

df = pd.DataFrame({'A': [1, 2, np.nan],
                   'B': [4, np.nan, np.nan],
                   'C': [7, 8, 9]})

print(df.isna().sum(axis=1))

上面的代码将创建一个包含三列的 Pandas DataFrame。然后使用 isna() 方法检查 DataFrame 中的 NaN 值，并使用 sum() 方法计算每行的 NaN 值的数量。输出结果如下：

0    0
1    2
2    0
dtype: int64

从输出结果可以看出，DataFrame 中的每行的 NaN 值数量分别为 0、2 和 0。

总结

在 Pandas 中计算 DataFrame 中每列或每行的 NaN 值数量非常简单。只需要使用 isna() 方法检查 DataFrame 中的 NaN 值，并使用 sum() 方法计算每列或每行的 NaN 值的数量。此外，还可以使用 dropna() 方法删除 DataFrame 中包含 NaN 值的行或列。掌握这些技巧可以使数据分析更加高效。

CDA数据分析师考试相关入口一览（建议收藏）：

▷ 想报名CDA认证考试，点击>>> “CDA报名” 了解CDA考试详情；