啊啊啊啊啊吖

2019-01-24   阅读量: 555

数据分析师 Python数据分析

基于两个标识符聚合行

扫码加入数据分析学习群

我有以下数据集

df = pd.DataFrame({'A' : ['E1', 'E1', 'E1', 'E2', 'E2'],

'B' : ['R1', 'R1', 'R2', 'R2', 'R2'],

'C' : [100, 100, 300, 250, 250]})

我现在想要使用A和B作为观察的共享标识符来聚合行。然后,我想计算总和和平均值C并计算观察该对的次数,并将这些值附加到数据帧。

df = pd.DataFrame({'A' : ['E1', 'E1', 'E2'],

'B' : ['R1', 'R2', 'R2'],

'C_sum' : [200, 300, 500],

'C_avg' : [100, 300, 250],

'count' : [2, 1, 2]})

####################

想到的解决办法:使用groupby与agg

df.groupby(['A','B']).C.agg(['sum','mean','count']).reset_index()

A B sum mean count

E1 R1 200 100 2

E2 R2 300 300 1

E2 R2 500 250 2

添加CDA认证专家【维克多阿涛】,微信号:【cdashijiazhuang】,提供数据分析指导及CDA考试秘籍。已助千人通过CDA数字化人才认证。欢迎交流,共同成长!
46.1538 1 2 关注作者 收藏

评论(0)


暂无数据

推荐课程

推荐帖子