从今天开始不熬夜

2022-09-02   阅读量: 1850

Python 统计学

建立线性回归模型的步骤

扫码加入数据分析学习群
  1. 1明确需求

  2. 2采集数据

  3. 3数据清洗: a.重复值的处理 b.缺失值的处理 c.异常值的处理 d.数据编码的处理

    其中缺失值的处理可以用均值或众数等描述数据集中趋势的进行填补,异常值中的错误值直接手动删除,离群值的 处理要具体看业务(通常通过画箱线图,或者3西格玛法则判断),数据编码的处理,对于男女这种二分类变量可以用 0和1转化,最好的是在此基础上加上交叉列(改斜率),多分类变量如学历这种,可以采用独热编码或哑变量转换,其 中的某列得删除,避免和线性回归模型中的常量在矩阵化时有相关性

  4. 4变量的筛选:查看X与Y的相关系数,查看散点图

  5. 5分割测试集训练集(做预测)

  6. 6回归建模(F检验,T检验,调整R^2)

  7. 7模型调优

  8. 8模型精修(交叉项,高次项,季节趋势)

  9. 9逐步回归

  10. 10模型测试

119.9997 3 0 关注作者 收藏

评论(0)


暂无数据

推荐课程

推荐帖子