朝阳Tim

2019-02-01   阅读量: 1240

统计学 数据分析师 SPSS

什么是多重共线性问题?如何解决?

扫码加入数据分析学习群

问题描述:

  • 在做多元线性模型的时候,往往出现“多重共线性问题”,这是什么?如何解决呢?


解决思路:

  • “多重共线性”可以理解为x和x之间太相近了,从VIF方差膨胀因子的计算公式就可以看出来,去掉y,其它x对被检验的x的解释能力,如果VIF值太高,说明这个x就没有存在于这个模型里的意义
VIF=1/(1-r2) ;当VIF大于10的时候,说明其余x对该x的解释力度达到了90%

  • “多重共线性”问题的产生原因,可能是数据质量,可能是误操作,例如哑变量没有剔除基准变量就进入模型
  • 以spss举例,在线性模型的菜单下勾选“共线性诊断”可以计算VIF的值


对于多重共线性问题,常见的解决策略,仅供参考:

  • 保留更重要的x,去掉与之共线性的x
  • 对相近的x做变量信息压缩,例如主成分或者因子分析
  • 对共线性问题的1个或几个x,做升格或降格处理

多重共线性问题的解决策略,参考链接:https://blog.csdn.net/wangcheng666666/article/details/79187703

添加CDA认证专家【维克多阿涛】,微信号:【cdashijiazhuang】,提供数据分析指导及CDA考试秘籍。已助千人通过CDA数字化人才认证。欢迎交流,共同成长!
0.0000 0 5 关注作者 收藏

评论(0)


暂无数据

推荐课程

推荐帖子