如何从 Pandas DataFrame 单元格获取值？-CDA数据分析师官网

热线电话：13121318867

如何从 Pandas DataFrame 单元格获取值？

2023-04-25

Pandas是一个广泛使用的Python库，用于数据分析和处理。Pandas中的核心数据结构是DataFrame，这是一个表格形式的数据结构，类似于Excel表格或SQL表。DataFrame具有许多功能，例如数据排序、过滤、统计和聚合等。

在DataFrame中，我们通常需要从单元格中获取值以执行特定操作。在本文中，我们将讨论如何从Pandas DataFrame单元格获取值。

一、通过行列索引器获取值

Pandas支持使用行和列索引器来获取单个单元格的值。以下是如何使用行列索引器来获取DataFrame中特定单元格的值的示例代码：

import pandas as pd

# 创建一个新的DataFrame对象
data = {'姓名': ['John', 'Mike', 'Sarah'], 
        '年龄': [25, 30, 27],
        '性别': ['男', '男', '女']}
df = pd.DataFrame(data)

# 从第二行第一列（0-based）的单元格获取值
value = df.iloc[1, 0]
print(value)

上述代码创建了一个包含三列数据的简单DataFrame对象，其中包含“姓名”、“年龄”和“性别”列。然后，我们使用iloc函数来获取第二行第一列（0-based）的单元格值，并将其存储到变量中。最后，使用print函数打印单元格的值。

二、使用at和iat方法获取单元格值

Pandas还提供了名为at和iat的两种方法，用于在DataFrame中获取单个值。这些方法比使用行列索引器更快，因为它们没有必要遍历整个DataFrame。

在使用at和iat方法时，您需要提供行和列的位置索引。以下是使用at和iat方法从DataFrame中获取值的示例代码：

import pandas as pd

# 创建一个新的DataFrame对象
data = {'姓名': ['John', 'Mike', 'Sarah'], 
        '年龄': [25, 30, 27],
        '性别': ['男', '男', '女']}
df = pd.DataFrame(data)

# 使用'at'方法获取第二行第一列（0-based）的单元格值
value1 = df.at[1, '姓名']
print(value1)

# 使用'iat'方法获取第二行第一列（0-based）的单元格值
value2 = df.iat[1, 0]
print(value2)

上述代码中，我们首先创建了一个包含三列数据的简单DataFrame对象。然后，我们使用at函数和iat函数分别获取第二行第一列（0-based）的单元格值，并将其存储到变量中。最后，我们使用print函数打印单元格的值。

三、使用loc和iloc方法获取多个单元格的值

有时，您可能需要从Pandas DataFrame中获取多个单元格的值。在这种情况下，您可以使用loc和iloc方法，这两种方法都可以用于选择行和列的子集。以下是如何使用loc和iloc方法从DataFrame中获取多个单元格值的示例代码：

import pandas as pd

# 创建一个新的DataFrame对象
data = {'姓名': ['John', 'Mike', 'Sarah'], 
        '年龄': [25, 30, 27],
        '性别': ['男', '男', '女']}
df = pd.DataFrame(data)

# 使用'loc'方法获取第一行至第二行，"姓名"至"年龄"列的所有单元格值
values1 = df.loc[0:1, '姓名':'年龄']
print(values1)

# 使用'iloc'方法获取第一行至第二行，第一列至第二列（0-based）的所有单元格值
values2 = df.iloc[0:2, 0:2]
print(values2)

上述代码中，我们首先创建了一个包

含三列数据的简单DataFrame对象。然后，我们使用loc方法和iloc方法分别获取第一行至第二行、"姓名"至"年龄"列的所有单元格值和第一行至第二行、第一列至第二列（0-based）的所有单元格值，并将它们存储到变量中。最后，我们使用print函数打印多个单元格的值。

四、使用apply方法获取单元格值

Pandas还提供了一个名为apply的方法，可以应用自定义函数来对DataFrame进行操作。您可以使用apply方法来获取每个单元格的值，并将其传递给自定义函数进行处理。例如，以下是如何使用apply方法从DataFrame中获取单个单元格的值的示例代码：

import pandas as pd

# 创建一个新的DataFrame对象
data = {'姓名': ['John', 'Mike', 'Sarah'], 
        '年龄': [25, 30, 27],
        '性别': ['男', '男', '女']}
df = pd.DataFrame(data)

# 定义一个函数，用于获取DataFrame中某个单元格的值
def get_value(row, col):
    return row[col]

# 使用'apply'方法获取第二行第一列（0-based）的单元格值，并将其传递给自定义函数进行处理
value = df.apply(lambda x: get_value(x, 0), axis=1).iloc[1]
print(value)

上述代码中，我们首先创建了一个包含三列数据的简单DataFrame对象。然后，我们定义了一个自定义函数get_value，用于获取DataFrame中某个单元格的值。接下来，我们使用apply方法从DataFrame中获取第二行第一列（0-based）的单元格值，并将其传递给自定义函数进行处理。最后，我们使用iloc函数和行索引器来选择返回值列表中的第二个元素，并将其存储到变量中。最终，我们使用print函数打印单元格的值。

总结

在本文中，我们讨论了如何从Pandas DataFrame单元格中获取值。我们介绍了使用行列索引器、at和iat方法、loc和iloc方法以及apply方法来获取单个单元格或多个单元格的值的示例代码。这些技术可以帮助您更有效地处理和操作Pandas DataFrame数据。

CDA数据分析师考试相关入口一览（建议收藏）：

▷ 想报名CDA认证考试，点击>>> “CDA报名” 了解CDA考试详情；