登录
首页大数据时代如何从 Pandas DataFrame 单元格获取值?
如何从 Pandas DataFrame 单元格获取值?
2023-04-25
收藏

Pandas是一个广泛使用的Python库,用于数据分析和处理。Pandas中的核心数据结构DataFrame,这是一个表格形式的数据结构,类似于Excel表格或SQL表。DataFrame具有许多功能,例如数据排序、过滤、统计和聚合等。

DataFrame中,我们通常需要从单元格中获取值以执行特定操作。在本文中,我们将讨论如何从Pandas DataFrame单元格获取值。

一、通过行列索引器获取值

Pandas支持使用行和列索引器来获取单个单元格的值。以下是如何使用行列索引器来获取DataFrame中特定单元格的值的示例代码:

import pandas as pd

# 创建一个新的DataFrame对象
data = {'姓名': ['John', 'Mike', 'Sarah'], 
        '年龄': [25, 30, 27],
        '性别': ['男', '男', '女']}
df = pd.DataFrame(data)

# 从第二行第一列(0-based)的单元格获取值
value = df.iloc[1, 0]
print(value)

上述代码创建了一个包含三列数据的简单DataFrame对象,其中包含“姓名”、“年龄”和“性别”列。然后,我们使用iloc函数来获取第二行第一列(0-based)的单元格值,并将其存储到变量中。最后,使用print函数打印单元格的值。

二、使用at和iat方法获取单元格值

Pandas还提供了名为atiat的两种方法,用于在DataFrame中获取单个值。这些方法比使用行列索引器更快,因为它们没有必要遍历整个DataFrame

在使用atiat方法时,您需要提供行和列的位置索引。以下是使用atiat方法从DataFrame中获取值的示例代码:

import pandas as pd

# 创建一个新的DataFrame对象
data = {'姓名': ['John', 'Mike', 'Sarah'], 
        '年龄': [25, 30, 27],
        '性别': ['男', '男', '女']}
df = pd.DataFrame(data)

# 使用'at'方法获取第二行第一列(0-based)的单元格值
value1 = df.at[1, '姓名']
print(value1)

# 使用'iat'方法获取第二行第一列(0-based)的单元格值
value2 = df.iat[1, 0]
print(value2)

上述代码中,我们首先创建了一个包含三列数据的简单DataFrame对象。然后,我们使用at函数和iat函数分别获取第二行第一列(0-based)的单元格值,并将其存储到变量中。最后,我们使用print函数打印单元格的值。

三、使用loc和iloc方法获取多个单元格的值

有时,您可能需要从Pandas DataFrame中获取多个单元格的值。在这种情况下,您可以使用lociloc方法,这两种方法都可以用于选择行和列的子集。以下是如何使用lociloc方法从DataFrame中获取多个单元格值的示例代码:

import pandas as pd

# 创建一个新的DataFrame对象
data = {'姓名': ['John', 'Mike', 'Sarah'], 
        '年龄': [25, 30, 27],
        '性别': ['男', '男', '女']}
df = pd.DataFrame(data)

# 使用'loc'方法获取第一行至第二行,"姓名"至"年龄"列的所有单元格值
values1 = df.loc[0:1, '姓名':'年龄']
print(values1)

# 使用'iloc'方法获取第一行至第二行,第一列至第二列(0-based)的所有单元格值
values2 = df.iloc[0:2, 0:2]
print(values2)

上述代码中,我们首先创建了一个包

含三列数据的简单DataFrame对象。然后,我们使用loc方法和iloc方法分别获取第一行至第二行、"姓名"至"年龄"列的所有单元格值和第一行至第二行、第一列至第二列(0-based)的所有单元格值,并将它们存储到变量中。最后,我们使用print函数打印多个单元格的值。

四、使用apply方法获取单元格值

Pandas还提供了一个名为apply的方法,可以应用自定义函数来对DataFrame进行操作。您可以使用apply方法来获取每个单元格的值,并将其传递给自定义函数进行处理。例如,以下是如何使用apply方法从DataFrame中获取单个单元格的值的示例代码:

import pandas as pd

# 创建一个新的DataFrame对象
data = {'姓名': ['John', 'Mike', 'Sarah'], 
        '年龄': [25, 30, 27],
        '性别': ['男', '男', '女']}
df = pd.DataFrame(data)

# 定义一个函数,用于获取DataFrame中某个单元格的值
def get_value(row, col):
    return row[col]

# 使用'apply'方法获取第二行第一列(0-based)的单元格值,并将其传递给自定义函数进行处理
value = df.apply(lambda x: get_value(x, 0), axis=1).iloc[1]
print(value)

上述代码中,我们首先创建了一个包含三列数据的简单DataFrame对象。然后,我们定义了一个自定义函数get_value,用于获取DataFrame中某个单元格的值。接下来,我们使用apply方法从DataFrame中获取第二行第一列(0-based)的单元格值,并将其传递给自定义函数进行处理。最后,我们使用iloc函数和行索引器来选择返回值列表中的第二个元素,并将其存储到变量中。最终,我们使用print函数打印单元格的值。

总结

在本文中,我们讨论了如何从Pandas DataFrame单元格中获取值。我们介绍了使用行列索引器、atiat方法、lociloc方法以及apply方法来获取单个单元格或多个单元格的值的示例代码。这些技术可以帮助您更有效地处理和操作Pandas DataFrame数据。

数据分析咨询请扫描二维码

客服在线
立即咨询