数据科学专业问答社区，好文章，一字千金--CDA答疑社区

CDA数据科学研究院 CDA考试中心 CDA网校企业服务

CDA社区

CDA竞赛 CDA技术答疑 CDA俱乐部

关于CDA APP下载

免密码登录

提交首次登录验证后自动注册

点赞能量: %
点赞价值:

你看这样可以吗 M0我直接用放款金额不再区分未滚到M1的金额了
预测1125.xlsx

0 0 0

wangxishi

2020-11-25

python 做预测

棒棒哒！给你点赞

0 0 0

白璐123

2020-11-25

python numpy中concatenate 按照axis=0，1，2进行合并系列

这个总结意义不大, 多看英文提示, 按照提示输入, 不需要死记参数顺序与含义.

0 0 0

CDA助教老师

2020-11-24

sumif和sumifs函数的区别

"不要去信仰任何一门具体的技术"
努力去沉淀自己的能力,准备时刻改变自己!

0 0 0

Hsail

2020-11-24

【数据从业成长之路访谈】【一】

老师,现在还有访谈吗

0 0 0

Hsail

2020-11-24

【数据从业之路访谈录】【序】

0 0 0

陈yy123

2020-11-24

Python集合的运算

好的谢谢

0 0 0

wangxishi

2020-11-24

用拟合出的多元线性方程画图

前面说反了
这个是把含缺失值的行的行号（行索引）找出来。先计算每行有多少个非缺失值，如果全部都是非缺失值，则非缺失值个数为13（一个y 12个x）,如果非缺失值个数少于13则需要删掉这一行

1 0 0

wangxishi

2020-11-24

用拟合出的多元线性方程画图

为什么<13呢

0 0 0

wangxishi

2020-11-24

用拟合出的多元线性方程画图

这个是把不含缺失只的行的行号（行索引）找出来

1 0 0

wangxishi

2020-11-24

用拟合出的多元线性方程画图

YX_2018.index[YX_2018.notnull().sum(axis=1)<13
这句是什么意思？

0 0 0

wangxishi

2020-11-24

用拟合出的多元线性方程画图

0 0 0

wangxishi

2020-11-24

python 做预测

我改了下公式，并做了两期，辛苦看下
预测1124.xlsx

0 0 0

wangxishi

2020-11-24

python 做预测

好的谢谢！

0 0 0

wangxishi

2020-11-24

用拟合出的多元线性方程画图

完整代码如下

# -- coding: utf-8 --
"""
Created on Mon Nov 23 11:01:18 2020

@author: Administrator
"""
#导入库
import pandas as pd
import numpy as np
#导入数据
data=pd.read_excel("D:\\360安全浏览器下载\\线性回归1119.xlsx")
#让时间显示为正确格式
#excel中以1900年1月1日为基准线记录时间
#python中以1970年1月1日为基准线记录时间
#进行时间转化的时候需要将从excel中导来的数值减去25539，再用pd.timestamp将其转换
data["时间"]=data["时间"].map(lambda x:x-25569)
data["时间"]=data["时间"].map(lambda x:pd.Timestamp(x,unit="D"))

data["年份"]=data["时间"].dt.year

#准备训练集（2018年及以前的数据）和测试集数据(2019年数据)
xnamelist=["沪深300",
"stock5","stock12",
"中国货币供应量M2(亿元)",
"M2_12",
"居民消费价格指数(上月=100)",
"居住类居民消费价格指数(上月=100)",
"新建商品住宅销售价格指数(上月=100)",
"二手住宅销售价格指数(上月=100)",
"银行间同业拆借加权平均利率_当期%",
"rate",
"美元兑人民币平均汇率_当期（人民币/美元）"

]

YX_2018=data[data["年份"]<=2018].loc[:,["Y"]+xnamelist]
#查看2018年及以前有多少行数据,可以看到有96行数据，你的变量x个数为12个
YX_2018.shape
#sklearn这个库建模和一般的统计学软件建模相比，sklearn这个库有不少缺点。
#其中一个缺点就是在做线性回归估计的时候要求传入的x和y不能有缺失值，
#因为系统不会自动筛选非缺失值进行建模和系数估计
#而是直接硬生生的给你抛出一个错误提示
#这就需要我们在进行建模前，人为进行缺失值处理。
#这里我们将含有缺失值的行直接从训练数据中删除。
YX_2018.notnull().sum(axis=0)
YX_2018.drop(labels = YX_2018.index[YX_2018.notnull().sum(axis=1)<13],axis=0,inplace=True)
#删除有缺失值的行之后，只剩下84行数据

YX_2019=data[data["年份"]==2019].loc[:,["Y"]+xnamelist]
#查看2019年有多少行数据,可以看到有12行数据，但是变量y有两个月的数据缺失
YX_2019.notnull().sum(axis=0)
#我们只对未缺失的行进行测试
YX_2019.drop(labels = YX_2019.index[YX_2019.notnull().sum(axis=1)<13],axis=0,inplace=True)

#导入线性回归类
from sklearn.linear_model import LinearRegression
#开始建模估计回归系数
#实例化一个回归模型
regmodel = LinearRegression()

#给模型传入测试集数据x和y
regmodel.fit(YX_2018.iloc[:,1:],YX_2018.iloc[:,0])#线性回归训练
#如果你想用sklearn库查看回归系数，可以用下面的命令
regmodel.intercept_ #常数项
regmodel.coef_ #斜率系数

#接下来我们只能直接进行预测，
Y_pred2018 = regmodel.predict(YX_2018.iloc[:,1:])#对测试集数据，用predict函数预测

Y_pred2019 = regmodel.predict(YX_2019.iloc[:,1:])#对测试集数据，用predict函数预测

#将预测值和实际值放在一起进行画图比较
import matplotlib.pyplot as plt
fig,axes=plt.subplots(2,1,figsize=(10,5))
#设定横轴刻度线标签值
xticklabels2018=data["时间"].loc[list(YX_2018.iloc[:,0].index)]
xticklabels2019=data["时间"].loc[list(YX_2019.iloc[:,0].index)]

axes[0].plot(xticklabels2018,YX_2018.iloc[:,0],'red', linewidth=2.5,label="real data2018")
axes[0].plot(xticklabels2018,Y_pred2018,'green',label="predict data2018")
axes[0].legend(loc = 'upper right') #添加图例

axes[1].plot(xticklabels2019,YX_2019.iloc[:,0],'red', linewidth=2.5,label="real data2019")
axes[1].plot(xticklabels2019,Y_pred2019,'green',label="predict data2019")
axes[1].legend(loc = 'upper right') #添加图例

1 0 0

wangxishi

2020-11-24

用拟合出的多元线性方程画图

Y_pred2018 = regmodel.predict(YX_2018.iloc[:,1:])#对测试集数据，用predict函数预测

Y_pred2019 = regmodel.predict(YX_2019.iloc[:,1:])#对测试集数据，用predict函数预测

#将预测值和实际值放在一起进行画图比较
import matplotlib.pyplot as plt
fig,axes=plt.subplots(2,1,figsize=(10,5))
#设定横轴刻度线标签值
xticklabels2018=data["时间"].loc[list(YX_2018.iloc[:,0].index)]
xticklabels2019=data["时间"].loc[list(YX_2019.iloc[:,0].index)]

axes[0].plot(xticklabels2018,YX_2018.iloc[:,0],'red', linewidth=2.5,label="real data2018")
axes[0].plot(xticklabels2018,Y_pred2018,'green',label="predict data2018")
axes[0].legend(loc = 'upper right') #添加图例

axes[1].plot(xticklabels2019,YX_2019.iloc[:,0],'red', linewidth=2.5,label="real data2019")
axes[1].plot(xticklabels2019,Y_pred2019,'green',label="predict data2019")
axes[1].legend(loc = 'upper right') #添加图例

1 0 0

wangxishi

2020-11-24

用拟合出的多元线性方程画图

其实你只要模仿2019年的情况就行19年的代码我前面已经写了，我再帮你写下2018代码吧，

1 0 0

wangxishi

2020-11-24

用拟合出的多元线性方程画图

能不能比如我拿13-18年的数据做模型，画出模型拟合出的方程曲线图

0 0 0

wangxishi

2020-11-24

用拟合出的多元线性方程画图

你要先预测才能画图，将预测的值和实际的这进行比较，你要用predict进行预测

0 0 0

wangxishi

2020-11-24

用拟合出的多元线性方程画图

regmodel.fit(YX_2018.iloc[:,1:],YX_2018.iloc[:,0])#线性回归训练
#如果你想用sklearn库查看回归系数，可以用下面的命令
regmodel.intercept_ #常数项
regmodel.coef_ #斜率系数
这步我想看到训练出来的模型画图，怎么做呢，就是画出训练的13-18年的图形

0 0 0

wangxishi

2020-11-24

用拟合出的多元线性方程画图

<1…808182…155>