pandas中如何求某个特定值在数据框中出现的次数？-CDA数据分析师官网

热线电话：13121318867

pandas中如何求某个特定值在数据框中出现的次数？

2023-05-09

在 Pandas 中，可以使用 value_counts() 方法来计算数据框中某个特定值出现的次数。这个方法可以应用于 Series 对象和 DataFrame 对象。

对于 Series 对象，value_counts() 方法返回一个 Series，其中包含每个唯一值出现的次数。例如，考虑以下示例代码：

import pandas as pd

# 创建一个简单的 Series 对象
s = pd.Series([1, 2, 3, 2, 1, 1, 4, 5])

# 计算每个唯一值出现的次数
counts = s.value_counts()

print(counts)

输出结果如下所示：

1    3
2    2
5    1
4    1
3    1
dtype: int64

可以看到，这个 Series 对象中的每个唯一值都被列出来了，并且在它们的下面显示了出现的次数。例如，值为 1 的元素出现了 3 次。

对于 DataFrame 对象，value_counts() 方法可以在指定列上计算每个唯一值出现的次数。例如，考虑以下示例代码：

import pandas as pd

# 创建一个简单的 DataFrame 对象
data = {'name': ['Alice', 'Bob', 'Charlie', 'David', 'Emma', 'Fred'],
        'age': [25, 35, 20, 30, 25, 35],
        'gender': ['F', 'M', 'M', 'M', 'F', 'M']}
df = pd.DataFrame(data)

# 计算“gender”列中每个唯一值出现的次数
counts = df['gender'].value_counts()

print(counts)

输出结果如下所示：

M    4
F    2
Name: gender, dtype: int64

可以看到，这个 DataFrame 对象中的“gender”列被选中，并且计算了其中每个唯一值（即“F”和“M”）出现的次数。例如，值为“M”的元素出现了 4 次。

除了 value_counts() 方法之外，还有一些其他方法可以用于计算数据框中某个特定值出现的次数。例如，可以使用 count() 方法来计算数据框中非缺失值的数量。考虑以下示例代码：

import pandas as pd
import numpy as np

# 创建一个包含缺失值的 DataFrame 对象
data = {'name': ['Alice', 'Bob', 'Charlie', 'David', 'Emma', 'Fred'],
        'age': [25, 35, np.nan, 30, 25, 35],
        'gender': ['F', 'M', 'M', 'M', 'F', 'M']}
df = pd.DataFrame(data)

# 计算“age”列中非缺失值的数量
count = df['age'].count()

print(count)

输出结果如下所示：

可以看到，这个 DataFrame 对象中的“age”列被选中，并且计算了其中非缺失值的数量。由于这个列中有一个缺失值，因此计算的结果为 5。

总之，在 Pandas 中，可以使用 value_counts() 方法来计算数据框中某个特定值出现的次数。对于 Series 对象，这个方法返回一个包含每个唯一值出现次数的 Series；对于 DataFrame 对象，这个方法可以在指定列上计算每个唯一值出现的次数。除了 value_counts() 方法之外，还有其他方法可以用于计算数据框中某个特定值出现的次数。

CDA数据分析师考试相关入口一览（建议收藏）：

▷ 想报名CDA认证考试，点击>>> “CDA报名” 了解CDA考试详情；