Pandas DataFrame可以看作是一个表。它将数据组织成行和列,使其成为二维数据结构。列具有不同的类型,并且DataFrame的大小是可变的,因此可以被修改。
要创建DataFrame,您可以选择从头开始或将其他数据结构(如Numpy数组)转换为DataFrame。以下是从头开始创建DataFrame的方法:
import pandas as pd
df = pd.DataFrame({
"Column1": [1, 4, 8, 7, 9],
"Column2": ['a', 'column', 'with', 'a', 'string'],
"Column3": [1.23, 23.5, 45.6, 32.1234, 89.453],
"Column4": [True, False, True, False, True]
})
print(df)
输出:
Column1 Column2 Column3 Column4
0 1 a 1.2300 True
1 4 column 23.5000 False
2 8 with 45.6000 True
3 7 a 32.1234 False
4 9 string 89.4530 True
在这个例子中,我们创建了一个名为的DataFrame df
。DataFrame的第一列具有整数值。第二列有一个字符串,第三列有浮点值,第四列有布尔值。
该语句print(df)
将通过控制台向我们显示DataFrame的内容,允许我们检查和验证其内容。
但是,在显示DataFrame时,您可能已经注意到表的开头有一个附加列,其元素从0开始。此列自动创建,它标记行的索引。
要创建DataFrame,我们必须调用pd.DataFrame()
上面示例中所示的方法。
我们可以从列表甚至一组列表中创建DataFrame。我们只需调用该pd.DataFrame()
方法,然后将list变量作为唯一参数传递给它。
请考虑以下示例:
import pandas as pd
mylist = [4, 8, 12, 16, 20]
df = pd.DataFrame(mylist)
print(df)
输出:
0
0 4
1 8
2 12
3 16
4 20
在这个例子中,我们创建了一个以mylist
5个整数序列命名的列表。然后我们调用该DataFrame()
方法并将列表的名称作为参数传递给它。这是将列表转换为DataFrame的位置。
然后我们打印出DataFrame的内容。DataFrame有一个显示索引的默认列,第一个元素位于索引0,最后一个元素位于索引N-1
,其中N是DataFrame中元素的总数。
三个资料Q群下载不了也转发不了,先放这里Fine_tuning.zipLangChain.zipdata_clear.rar