热线电话:13121318867

登录
2020-04-13 阅读量: 656
Python中遇到缺失值如何处理?

迭代(循环)次数可能的话超过40,选择所有的变量量甚至额外的辅助变量

详细的计算过程参考:Multiple Imputation by Chained Equations: What is it and how does it work?

占比较少: 10%以下进⾏行行单一值替换,如中位数,众数

在决策树中可以将缺失值处理融合到算法里:按⽐比重分配

这里的占比并不是固定的,例例如缺失值占比只有5%,仍可以用第二种⽅方法,主要依据业务逻辑和算法需求。

29.3429
2
关注作者
收藏
评论(0)

发表评论

暂无数据
推荐帖子