2020-10-28
阅读量:
775
python 中数据框对象如何生成组内秩?也就是组内排名
#python 中数据框对象如何生成组内秩?也就是组内排名
import pandas as pd
data=pd.DataFrame(data=[["张三",30],
["李四",30],
["张三",20],
["李四",25]],columns=["姓名","分数"])
data.sort_values(by=["姓名","分数"],inplace=True)

data["总体秩"]=pd.Series(range(len(data["分数"])),index=data.index)

data["groupmin总体秩"]=data["总体秩"].groupby([data["姓名"]]).transform(np.min)

data["组内秩"]=data["总体秩"]-data["groupmin总体秩"]+1

到此完成组内秩的计算过程。下面给出连续完整代码如下:
#python 中数据框对象如何生成组内秩?也就是组内排名
import pandas as pd
data=pd.DataFrame(data=[["张三",30],
["李四",30],
["张三",20],
["李四",25]],columns=["姓名","分数"])
data.sort_values(by=["姓名","分数"],inplace=True)
data["总体秩"]=pd.Series(range(len(data["分数"])),index=data.index)
data["groupmin总体秩"]=data["总体秩"].groupby([data["姓名"]]).transform(np.min)
data["组内秩"]=data["总体秩"]-data["groupmin总体秩"]+1
0.0041
3
0
关注作者
收藏
评论(0)
发表评论
暂无数据

