热线电话:13121318867

登录
2018-12-10 阅读量: 741
在python里怎么分组

通过“分组依据”,我们指的是涉及以下一个或多个步骤的过程:

  • 根据某些标准将数据拆分为组
  • 功能独立应用于每个组
  • 结果组合到数据结构中
 df = pd.DataFrame({'A' : ['foo', 'bar', 'foo', 'bar',
....: 'foo', 'bar', 'foo', 'foo'],
....: 'B' : ['one', 'one', 'two', 'three',
....: 'two', 'two', 'one', 'three'],
....: 'C' : np.random.randn(8),
....: 'D' : np.random.randn(8)})
....:

df

A B C D
0 foo one -1.202872 -0.055224
1 bar one -1.814470 2.395985
2 foo two 1.018601 1.552825
3 bar three -0.595447 0.166599
4 foo two 1.395433 0.047609
5 bar two -0.392670 -0.136473
6 foo one 0.007207 -0.561757
7 foo three 1.928123 -1.623033

分组然后将sum()函数应用于结果组。

 df.groupby('A').sum() Out[93]:              C        D A                      bar -2.802588  2.42611 foo  3.146492 -0.63958

按多列分组形成分层索引,我们可以再次应用该sum功能。

df.groupby(['A','B']).sum() 
C D A B bar one -1.814470 2.395985 three -0.595447 0.166599 two -0.392670 -0.136473 foo one -1.195665 -0.616981 three 1.928123 -1.623033 two 2.414034 1.600434
0.0000
0
关注作者
收藏
评论(0)

发表评论

暂无数据
推荐帖子