热线电话:13121318867

登录
2019-01-24 阅读量: 713
基于两个标识符聚合行

我有以下数据集

df = pd.DataFrame({'A' : ['E1', 'E1', 'E1', 'E2', 'E2'],

'B' : ['R1', 'R1', 'R2', 'R2', 'R2'],

'C' : [100, 100, 300, 250, 250]})

我现在想要使用A和B作为观察的共享标识符来聚合行。然后,我想计算总和和平均值C并计算观察该对的次数,并将这些值附加到数据帧。

df = pd.DataFrame({'A' : ['E1', 'E1', 'E2'],

'B' : ['R1', 'R2', 'R2'],

'C_sum' : [200, 300, 500],

'C_avg' : [100, 300, 250],

'count' : [2, 1, 2]})

####################

想到的解决办法:使用groupby与agg

df.groupby(['A','B']).C.agg(['sum','mean','count']).reset_index()

A B sum mean count

E1 R1 200 100 2

E2 R2 300 300 1

E2 R2 500 250 2

46.1538
2
关注作者
收藏
评论(0)

发表评论

暂无数据
推荐帖子