Pandas精简笔记_CDA答疑社区

Pandas：

-Series:
一、操作：
1.Series：带有名称和索引的一维数组。
2.构建：pd.Series(data) / pd.Series(data ,name=' ' , index= [''])
data.index.name = ""
3.提取：
s.name # 提取名称
s.index # 提取索引
s.values # 提取值
s.dtype # 提取数据类型
s.index.name # 索引名称
4.增加/修改元素：s["a"] = xx
5.删除元素：df.pop()可以弹出指定数据，df.drop("a" , inplace = True/False)
#当True时直接在原数据中进行操作；False时生成新数据，原数据不变。
#删除多个需要用[ ]打包。

二、索引和切片：
1.按照字典的方式：s.get(key, default=None) / s( : )
2.按照列表的方式：s[ : : ]
3.按照序列的方式：s[ [0, 1, -1] ] （注意：必须打包传递）

-DataFrame:
一、操作：
1.DataFrame：是一个带有索引的二维数据结构
2.构建：
字典构建：data = {
"年龄": [19, 3000, 30, 37, 40, 1500],
"城市": ["纽约皇后区", "泰坦星球", "费城", "纽约", "哥谭", "阿斯加德"],
"装备": ['蜘蛛战服', '无限手套', '披风', '动力装甲', '蝙蝠战衣', '雷神之锤']
}
index = ['蜘蛛侠', '灭霸', '奇异博士', '钢铁侠', '蝙蝠侠', '索尔']
df = pd.DataFrame(data=data,index=index )

列表构建：data = [
[19, "纽约皇后区",'蜘蛛战服'],
[3000, "泰坦星球",'无限手套'],
[30, "费城",'披风'],
[37, "纽约",'动力装甲'],
[40, "哥谭",'蝙蝠战衣'],
[1500, "阿斯加德",'雷神之锤']
]
index = ['蜘蛛侠', '灭霸', '奇异博士', '钢铁侠', '蝙蝠侠', '索尔']
df = pd.DataFrame(data, columns=['年龄', '城市','装备'], index=index)

二、索引和切片：（以df表为例）
1.提取列数据：df['年龄'] / df[['年龄','城市']] 或者 df.年龄
2.提取元素：df.loc[索引行,索引列 ]

三、增删：（以df表为例）
1.新增行：df.loc['黑寡妇'] = ['43','前苏联','手枪']；新增列：df['性别'] = '男'
2.删除行：df.drop("钢铁侠")；删除列：df.drop(columns=['年龄','城市'])

四、查看基本信息：（以grade表为例）
1.前后n行：grade.head(n)，grade.tail(n)
2.数据形状：grade.shape
3.基本信息：grade.info()
4.通过掩码获取信息：grade[grade.班名次 == 30]

五、读取和保存数据：
1.本地读取：
pd.read_csv("文件名",各参数)

#参数说明:

- filepath_or_buffer, 文件路径
- sep=',', 文件分隔符
- delimiter=None, 同上
- header='infer', 用哪一行作为列名
- names=None, 当读取进来没有列名的时候, 可以用这个设置列名
- index_col=None, 用哪一列作为数据行索引

2.保存：
pd.to_csv('new_grade.csv')