热线电话:13121318867

登录
2018-12-05 阅读量: 695
通用函数--索引对齐

当两个series或dataframe对象上进行二元计算时,pandas会在计算的过程中对其两个对象的索引,当处理不完整的数据时,这会很方便


#series索引对齐
'''假如要整合两个数据源'''
area=pd.Series({'Alaska': 1723337, 'Texas': 695662,
'California': 423967}, name='area')
population = pd.Series({'California': 38332521, 'Texas': 26448193,
'New York': 19651127}, name='population')
population/area

[71]:
Alaska NaN California 90.413926 New York NaN Texas 38.018740 dtype: float64

结果数组的索引是两个输入数组索引的并集,也可用python标准库里的集合运算法则来获得索引

[73]:
area.index|population.index

[73]:
Index(['Alaska', 'California', 'New York', 'Texas'], dtype='object')

如果用 NaN 值不是我们想要的结果, 那么可以用适当的对象方法代。例如, A.add(B) 等价于 A + B, 也可以设置参数自定 义 A 或 B 缺失的数据

A.add(B,fill_value=0)

0.0000
4
关注作者
收藏
评论(0)

发表评论

暂无数据
推荐帖子