通用函数--索引对齐

啊啊啊啊啊吖

2018-12-05 阅读量: 923

通用函数--索引对齐

当两个series或dataframe对象上进行二元计算时，pandas会在计算的过程中对其两个对象的索引，当处理不完整的数据时，这会很方便

#series索引对齐
'''假如要整合两个数据源'''
area=pd.Series({'Alaska': 1723337, 'Texas': 695662,
'California': 423967}, name='area')
population = pd.Series({'California': 38332521, 'Texas': 26448193,
'New York': 19651127}, name='population')
population/area

[71]:
Alaska NaN California 90.413926 New York NaN Texas 38.018740 dtype: float64

结果数组的索引是两个输入数组索引的并集，也可用python标准库里的集合运算法则来获得索引

[73]:
area.index|population.index

[73]:
Index(['Alaska', 'California', 'New York', 'Texas'], dtype='object')

如果用 NaN 值不是我们想要的结果，那么可以用适当的对象方法代。例如， A.add(B) 等价于 A + B，也可以设置参数自定义 A 或 B 缺失的数据

A.add(B,fill_value=0)

0.0000

关注作者

发表评论

暂无数据

CDA考试动态

CDA报考指南

推荐帖子