Pandas是一个广泛使用的Python库,用于数据分析和处理。Pandas中的核心数据结构是DataFrame,这是一个表格形式的数据结构,类似于Excel表格或SQL表。DataFrame具有许多功能,例如数据排序、过滤、统计和聚合等。
在DataFrame中,我们通常需要从单元格中获取值以执行特定操作。在本文中,我们将讨论如何从Pandas DataFrame单元格获取值。
一、通过行列索引器获取值
Pandas支持使用行和列索引器来获取单个单元格的值。以下是如何使用行列索引器来获取DataFrame中特定单元格的值的示例代码:
import pandas as pd
# 创建一个新的DataFrame对象
data = {'姓名': ['John', 'Mike', 'Sarah'],
'年龄': [25, 30, 27],
'性别': ['男', '男', '女']}
df = pd.DataFrame(data)
# 从第二行第一列(0-based)的单元格获取值
value = df.iloc[1, 0]
print(value)
上述代码创建了一个包含三列数据的简单DataFrame对象,其中包含“姓名”、“年龄”和“性别”列。然后,我们使用iloc
函数来获取第二行第一列(0-based)的单元格值,并将其存储到变量中。最后,使用print
函数打印单元格的值。
二、使用at和iat方法获取单元格值
Pandas还提供了名为at
和iat
的两种方法,用于在DataFrame中获取单个值。这些方法比使用行列索引器更快,因为它们没有必要遍历整个DataFrame。
在使用at
和iat
方法时,您需要提供行和列的位置索引。以下是使用at
和iat
方法从DataFrame中获取值的示例代码:
import pandas as pd
# 创建一个新的DataFrame对象
data = {'姓名': ['John', 'Mike', 'Sarah'],
'年龄': [25, 30, 27],
'性别': ['男', '男', '女']}
df = pd.DataFrame(data)
# 使用'at'方法获取第二行第一列(0-based)的单元格值
value1 = df.at[1, '姓名']
print(value1)
# 使用'iat'方法获取第二行第一列(0-based)的单元格值
value2 = df.iat[1, 0]
print(value2)
上述代码中,我们首先创建了一个包含三列数据的简单DataFrame对象。然后,我们使用at
函数和iat
函数分别获取第二行第一列(0-based)的单元格值,并将其存储到变量中。最后,我们使用print
函数打印单元格的值。
三、使用loc和iloc方法获取多个单元格的值
有时,您可能需要从Pandas DataFrame中获取多个单元格的值。在这种情况下,您可以使用loc
和iloc
方法,这两种方法都可以用于选择行和列的子集。以下是如何使用loc
和iloc
方法从DataFrame中获取多个单元格值的示例代码:
import pandas as pd
# 创建一个新的DataFrame对象
data = {'姓名': ['John', 'Mike', 'Sarah'],
'年龄': [25, 30, 27],
'性别': ['男', '男', '女']}
df = pd.DataFrame(data)
# 使用'loc'方法获取第一行至第二行,"姓名"至"年龄"列的所有单元格值
values1 = df.loc[0:1, '姓名':'年龄']
print(values1)
# 使用'iloc'方法获取第一行至第二行,第一列至第二列(0-based)的所有单元格值
values2 = df.iloc[0:2, 0:2]
print(values2)
上述代码中,我们首先创建了一个包
含三列数据的简单DataFrame对象。然后,我们使用loc
方法和iloc
方法分别获取第一行至第二行、"姓名"至"年龄"列的所有单元格值和第一行至第二行、第一列至第二列(0-based)的所有单元格值,并将它们存储到变量中。最后,我们使用print
函数打印多个单元格的值。
四、使用apply方法获取单元格值
Pandas还提供了一个名为apply
的方法,可以应用自定义函数来对DataFrame进行操作。您可以使用apply
方法来获取每个单元格的值,并将其传递给自定义函数进行处理。例如,以下是如何使用apply
方法从DataFrame中获取单个单元格的值的示例代码:
import pandas as pd
# 创建一个新的DataFrame对象
data = {'姓名': ['John', 'Mike', 'Sarah'],
'年龄': [25, 30, 27],
'性别': ['男', '男', '女']}
df = pd.DataFrame(data)
# 定义一个函数,用于获取DataFrame中某个单元格的值
def get_value(row, col):
return row[col]
# 使用'apply'方法获取第二行第一列(0-based)的单元格值,并将其传递给自定义函数进行处理
value = df.apply(lambda x: get_value(x, 0), axis=1).iloc[1]
print(value)
上述代码中,我们首先创建了一个包含三列数据的简单DataFrame对象。然后,我们定义了一个自定义函数get_value
,用于获取DataFrame中某个单元格的值。接下来,我们使用apply
方法从DataFrame中获取第二行第一列(0-based)的单元格值,并将其传递给自定义函数进行处理。最后,我们使用iloc
函数和行索引器来选择返回值列表中的第二个元素,并将其存储到变量中。最终,我们使用print
函数打印单元格的值。
总结
在本文中,我们讨论了如何从Pandas DataFrame单元格中获取值。我们介绍了使用行列索引器、at
和iat
方法、loc
和iloc
方法以及apply
方法来获取单个单元格或多个单元格的值的示例代码。这些技术可以帮助您更有效地处理和操作Pandas DataFrame数据。
数据分析咨询请扫描二维码