dataframe数据重组，题目详情见正文_CDA答疑社区

热线电话：13121318867

登录

yuechuchen

2020-04-27 阅读量: 838

dataframe数据重组，题目详情见正文

每个机顶盒查看各个频道的时长，详情如下，

按照时长计算每个机顶盒的偏好频道，实现效果如下表：

参考答案：

data = pd.DataFrame()

data["机顶盒设备号"] = ["10001","10001","10002","10002","10002","10002","10003","10003","10003","10003" ,"10004","10004","10005","10005","10005"]

data["频道名称"] = ["东方卫视","翡翠台","浙江卫视","江苏卫视","珠江电影","卡酷动画","湖南卫视","中央5台","北京卫视","广东卫视" ,"福建卫视","江西卫视","河北卫视","河南卫视","陕西卫视"]

np.random.seed(0)

data["时长"] = abs(np.random.randn(15))

data_s = data.sort_values(["机顶盒设备号","时长"],ascending=[True,False])

s = data_s.机顶盒设备号.value_counts().sort_index()

list1 = []

for i in s.index:

for j in range(s[i]):

list1.append(j)

data_s.index = list1

gp1 = data_s.groupby("机顶盒设备号").apply(lambda x : x.sort_values("时长",ascending = False))

gp1["频道名称"].unstack()

0.0000

0

1

关注作者

收藏

评论(0)

发表评论

暂无数据

CDA考试动态

CDA报考指南

推荐帖子