当两个series或dataframe对象上进行二元计算时,pandas会在计算的过程中对其两个对象的索引,当处理不完整的数据时,这会很方便
#series索引对齐
'''假如要整合两个数据源'''
area=pd.Series({'Alaska': 1723337, 'Texas': 695662,
'California': 423967}, name='area')
population = pd.Series({'California': 38332521, 'Texas': 26448193,
'New York': 19651127}, name='population')
population/area
[71]:
Alaska NaN California 90.413926 New York NaN Texas 38.018740 dtype: float64
结果数组的索引是两个输入数组索引的并集,也可用python标准库里的集合运算法则来获得索引
[73]:
area.index|population.index
[73]:
Index(['Alaska', 'California', 'New York', 'Texas'], dtype='object')
如果用 NaN 值不是我们想要的结果, 那么可以用适当的对象方法代。例如, A.add(B) 等价于 A + B, 也可以设置参数自定 义 A 或 B 缺失的数据
A.add(B,fill_value=0)








暂无数据