ermutuxia
- 在2018年12月20日加入
- 点赞能量: 100%
- 点赞价值: 94822.8
先解决你第一个问题:计算每个学校各个项目的金额差。importpandasaspd
data202007=pd.DataFrame([["A学校","项目1",300],
["A学校","项目2",500],
["B学校","项目1",200],
["B学校","项目2",300]],columns=["学校id","项目名称","金额"])
data202008=pd.DataFrame([["A学校","项目1",200],
["A学校","项目2",500],
["B学校","项目1",200],
["B学校","项目2",300],
["B学校","项目3",200]],columns=["学校id","项目名称","金额"])#将两个数据框进行横向合并
data并=pd.merge(data202007,data202008,
on=["学校id","项目名称"],how=....
-
-
lihui15
2020-08-11
-
importpandasaspddata202007=pd.DataFrame([["A学校","项目1",300],["A学校","项目1",500],["B学校","项目1",200],["B学校","项目2",300]],columns=["学校id","项目名称","金额"])data202008=pd.DataFrame([["A学校","项目1",200],["A学校","项目1",500],["B学校","项目1",200],["B学校","项目2",300],["B学校","项目3",200]],columns=["学校id","项目名称","金额"])原始数据是类似于这样的数据框吗?
-
-
lihui15
2020-08-11
-
测试
-
-
wangxishi
2020-08-07
-
data1=pd.DataFrame(np.random.random_integers(1,1000,(100,3)))data1.columns=["x1","x2","x3"]上面这两句的意思是导入数据或者生成模拟数据,只要生成一个数据框对象就行,根据你前面的截图,你已经有数据框了,不需要执行这两句。你需要用到的是下面这句data1["x1均匀分箱"]=pd.qcut(data1["x1"],4,labels=["a","b","c","d"])pd.qcut是对变量进行分位数分箱,data1["x1"]是你对哪个变量进行分箱,4是分箱分成4类,labels参数设定这四类的标签,如果不设定就会用0、1、2、3代替。
-
-
wangxishi
2020-08-06
-
-
-
wangxishi
2020-08-06
-
你试一下下面的代码importpandasaspdimportnumpyasnp#模拟一些数据data1=pd.DataFrame(np.random.random_integers(1,1000,(100,3)))data1.columns=["x1","x2","x3"]data1["x1均匀分箱"]=pd.qcut(data1["x1"],4,labels=["a","b","c","d"])
-
-
wangxishi
2020-08-06
-
-
-
lll
2020-06-28
-