Pandas:
-Series:
一、操作:
1.Series:带有名称和索引的一维数组。
2.构建:pd.Series(data) / pd.Series(data ,name=' ' , index= [''])
data.index.name = ""
3.提取:
s.name # 提取名称
s.index # 提取 索引
s.values # 提取 值
s.dtype # 提取 数据类型
s.index.name # 索引名称
4.增加/修改元素:s["a"] = xx
5.删除元素:df.pop()可以弹出指定数据,df.drop("a" , inplace = True/False)
#当True时直接在原数据中进行操作;False时生成新数据,原数据不变。
#删除多个需要用[ ]打包。
二、索引和切片:
1.按照字典的方式:s.get(key, default=None) / s( : )
2.按照列表的方式:s[ : : ]
3.按照序列的方式:s[ [0, 1, -1] ] (注意:必须打包传递)
-DataFrame:
一、操作:
1.DataFrame:是一个带有索引的二维数据结构
2.构建:
字典构建:data = {
"年龄": [19, 3000, 30, 37, 40, 1500],
"城市": ["纽约皇后区", "泰坦星球", "费城", "纽约", "哥谭", "阿斯加德"],
"装备": ['蜘蛛战服', '无限手套', '披风', '动力装甲', '蝙蝠战衣', '雷神之锤']
}
index = ['蜘蛛侠', '灭霸', '奇异博士', '钢铁侠', '蝙蝠侠', '索尔']
df = pd.DataFrame(data=data,index=index )
列表构建:data = [
[19, "纽约皇后区",'蜘蛛战服'],
[3000, "泰坦星球",'无限手套'],
[30, "费城",'披风'],
[37, "纽约",'动力装甲'],
[40, "哥谭",'蝙蝠战衣'],
[1500, "阿斯加德",'雷神之锤']
]
index = ['蜘蛛侠', '灭霸', '奇异博士', '钢铁侠', '蝙蝠侠', '索尔']
df = pd.DataFrame(data, columns=['年龄', '城市','装备'], index=index)
二、索引和切片:(以df表为例)
1.提取列数据:df['年龄'] / df[['年龄','城市']] 或者 df.年龄
2.提取元素:df.loc[索引行,索引列 ]
三、增删:(以df表为例)
1.新增行:df.loc['黑寡妇'] = ['43','前苏联','手枪'];新增列:df['性别'] = '男'
2.删除行:df.drop("钢铁侠");删除列:df.drop(columns=['年龄','城市'])
四、查看基本信息:(以grade表为例)
1.前后n行:grade.head(n),grade.tail(n)
2.数据形状:grade.shape
3.基本信息:grade.info()
4.通过掩码获取信息:grade[grade.班名次 == 30]
五、读取和保存数据:
1.本地读取:
pd.read_csv("文件名",各参数)
#参数说明:
- filepath_or_buffer, 文件路径
- sep=',', 文件分隔符
- delimiter=None, 同上
- header='infer', 用哪一行作为列名
- names=None, 当读取进来没有列名的时候, 可以用这个设置列名
- index_col=None, 用哪一列作为数据行索引
2.保存:
pd.to_csv('new_grade.csv')








暂无数据