我有以下数据集
df = pd.DataFrame({'A' : ['E1', 'E1', 'E1', 'E2', 'E2'],
'B' : ['R1', 'R1', 'R2', 'R2', 'R2'],
'C' : [100, 100, 300, 250, 250]})
我现在想要使用A和B作为观察的共享标识符来聚合行。然后,我想计算总和和平均值C并计算观察该对的次数,并将这些值附加到数据帧。
df = pd.DataFrame({'A' : ['E1', 'E1', 'E2'],
'B' : ['R1', 'R2', 'R2'],
'C_sum' : [200, 300, 500],
'C_avg' : [100, 300, 250],
'count' : [2, 1, 2]})
####################
想到的解决办法:使用groupby与agg
df.groupby(['A','B']).C.agg(['sum','mean','count']).reset_index()
A B sum mean count
E1 R1 200 100 2
E2 R2 300 300 1
E2 R2 500 250 2
三个资料Q群下载不了也转发不了,先放这里Fine_tuning.zipLangChain.zipdata_clear.rar