詹惠儿

2021-06-01   阅读量: 390

数据分析师

前面提到的30%-75%缺失数据用虚拟变量填补,0代表缺失,1无缺失,那么填充完这一列怎么理解

扫码加入数据分析学习群

问:

前面提到的30%-75%缺失数据用虚拟变量填补,0代表缺失,1无缺失,那么填充完这一列怎么理解,这一列还能放入决策树模型吗,感觉解释不了


答:

缺失值单独作为一类时,值是1代表该变量为缺失,0代表该变量不缺失,是可以放进模型的,不过解释起来不太好,只能说是以该变量是否缺失为参考,这样处理是为了不损失其他数据信息


120.0000 1 0 关注作者 收藏

评论(0)


暂无数据

推荐课程

推荐帖子