pandas数据类型（二）

詹惠儿

2018-11-13 阅读量: 1157

pandas数据类型（二）

数据框

Pandas DataFrame可以看作是一个表。它将数据组织成行和列，使其成为二维数据结构。列具有不同的类型，并且DataFrame的大小是可变的，因此可以被修改。

要创建DataFrame，您可以选择从头开始或将其他数据结构（如Numpy数组）转换为DataFrame。以下是从头开始创建DataFrame的方法：

import pandas as pd  
df = pd.DataFrame({  
    "Column1": [1, 4, 8, 7, 9],
    "Column2": ['a', 'column', 'with', 'a', 'string'],
    "Column3": [1.23, 23.5, 45.6, 32.1234, 89.453],
    "Column4": [True, False, True, False, True]
})
print(df)

输出：

   Column1 Column2  Column3  Column4
0        1       a   1.2300     True  
1        4  column  23.5000    False  
2        8    with  45.6000     True  
3        7       a  32.1234    False  
4        9  string  89.4530     True

在这个例子中，我们创建了一个名为的DataFrame df。DataFrame的第一列具有整数值。第二列有一个字符串，第三列有浮点值，第四列有布尔值。

该语句print(df)将通过控制台向我们显示DataFrame的内容，允许我们检查和验证其内容。

但是，在显示DataFrame时，您可能已经注意到表的开头有一个附加列，其元素从0开始。此列自动创建，它标记行的索引。

要创建DataFrame，我们必须调用pd.DataFrame()上面示例中所示的方法。

我们可以从列表甚至一组列表中创建DataFrame。我们只需调用该pd.DataFrame()方法，然后将list变量作为唯一参数传递给它。

请考虑以下示例：

import pandas as pd  
mylist = [4, 8, 12, 16, 20]  
df = pd.DataFrame(mylist)  
print(df)

输出：

在这个例子中，我们创建了一个以mylist5个整数序列命名的列表。然后我们调用该DataFrame()方法并将列表的名称作为参数传递给它。这是将列表转换为DataFrame的位置。

然后我们打印出DataFrame的内容。DataFrame有一个显示索引的默认列，第一个元素位于索引0，最后一个元素位于索引N-1，其中N是DataFrame中元素的总数。

0.0000

关注作者

发表评论

暂无数据

CDA考试动态

CDA报考指南

推荐帖子