朝阳Tim

2019-02-11   阅读量: 1431

SPSS 数据分析师 Python数据分析

多元线性模型中可以将分类变量、顺序变量作为自变量吗?

扫码加入数据分析学习群

问题描述:

多元线性模型,特别是研究影响因素的模型,例如研究房价的影响因素有哪些,可以将楼层、学区、地铁这样的类别变量直接放进模型吗?为什么不行?


思路解读:

不能直接放进模型,因为不能合理解释回归系数。

举例来看,当研究“房屋面积”和“房价”的关系时候,我们解读系数为“每提示一个单位的x,带来多少的y”

对于顺序变量,例如研究“楼层”和“房价”的关系时候,并不能说每增加一个楼层,就提示多少的房价,因为样本的总楼层数不一致,不能够拿三层的别墅和二十几层的公寓的楼层多少,去研究房价变化

对于分类变量,比如研究“宗教信仰”与“幸福感”的关系中,不能说“无信仰者”比“基督教信仰者”多了多少个单位的x,变量各水平之间并不存在能够运算的单位关系,只能说不等于而已

因此对于分类变量、顺序变量,去研究它们和因变量的关系时候,需要做预处理,即哑变量操作

添加CDA认证专家【维克多阿涛】,微信号:【cdashijiazhuang】,提供数据分析指导及CDA考试秘籍。已助千人通过CDA数字化人才认证。欢迎交流,共同成长!
0.0000 0 1 关注作者 收藏

评论(0)


暂无数据

推荐课程

推荐帖子