2019-06-05
阅读量:
733
Pandas GroupBy查询
现在我想要像下面那样转换数据框,其中属性“类别”根据排序的日期值(%m /%d /%Y)被每个customerid的分隔符连接起来。具有较早日期的订单的类别首先列在相应的客户ID中。
期望/转换的数据框架
解决办法:首先通过转换列to_datetime,然后sort_values和最后groupby用join:
df['Date'] = pd.to_datetime(df['Date'], format='%m/%d/%Y')
df = (df.sort_values(['customerid','Age','Date'])
.groupby(['customerid','Age'])['category']
.agg(', '.join)
.reset_index())
print (df)
customerid Age category
0 1 10 Electronics, Clothing
1 2 25 Grocery, Clothing






评论(0)


暂无数据