詹惠儿

2018-11-13   阅读量: 695

数据分析师 Python编程 Python数据分析

pandas数据类型(二)

扫码加入数据分析学习群

数据框

Pandas DataFrame可以看作是一个表。它将数据组织成行和列,使其成为二维数据结构。列具有不同的类型,并且DataFrame的大小是可变的,因此可以被修改。

要创建DataFrame,您可以选择从头开始或将其他数据结构(如Numpy数组)转换为DataFrame。以下是从头开始创建DataFrame的方法:

import pandas as pd  
df = pd.DataFrame({
"Column1": [1, 4, 8, 7, 9],
"Column2": ['a', 'column', 'with', 'a', 'string'],
"Column3": [1.23, 23.5, 45.6, 32.1234, 89.453],
"Column4": [True, False, True, False, True]
})
print(df)

输出:

   Column1 Column2  Column3  Column4
0 1 a 1.2300 True
1 4 column 23.5000 False
2 8 with 45.6000 True
3 7 a 32.1234 False
4 9 string 89.4530 True

在这个例子中,我们创建了一个名为的DataFrame df。DataFrame的第一列具有整数值。第二列有一个字符串,第三列有浮点值,第四列有布尔值。

该语句print(df)将通过控制台向我们显示DataFrame的内容,允许我们检查和验证其内容。

但是,在显示DataFrame时,您可能已经注意到表的开头有一个附加列,其元素从0开始。此列自动创建,它标记行的索引。

要创建DataFrame,我们必须调用pd.DataFrame()上面示例中所示的方法。

我们可以从列表甚至一组列表中创建DataFrame。我们只需调用该pd.DataFrame()方法,然后将list变量作为唯一参数传递给它。

请考虑以下示例:

import pandas as pd  
mylist = [4, 8, 12, 16, 20]
df = pd.DataFrame(mylist)
print(df)

输出:

  0
0 4
1 8
2 12
3 16
4 20

在这个例子中,我们创建了一个以mylist5个整数序列命名的列表。然后我们调用该DataFrame()方法并将列表的名称作为参数传递给它。这是将列表转换为DataFrame的位置。

然后我们打印出DataFrame的内容。DataFrame有一个显示索引的默认列,第一个元素位于索引0,最后一个元素位于索引N-1,其中N是DataFrame中元素的总数。

添加CDA认证专家【维克多阿涛】,微信号:【cdashijiazhuang】,提供数据分析指导及CDA考试秘籍。已助千人通过CDA数字化人才认证。欢迎交流,共同成长!
0.0000 0 5 关注作者 收藏

评论(0)


暂无数据

推荐课程

推荐帖子