2020-04-13
阅读量:
656
Python中遇到缺失值如何处理?

迭代(循环)次数可能的话超过40,选择所有的变量量甚至额外的辅助变量
详细的计算过程参考:Multiple Imputation by Chained Equations: What is it and how does it work?
占比较少: 10%以下进⾏行行单一值替换,如中位数,众数
在决策树中可以将缺失值处理融合到算法里:按⽐比重分配
这里的占比并不是固定的,例例如缺失值占比只有5%,仍可以用第二种⽅方法,主要依据业务逻辑和算法需求。






评论(0)


暂无数据
推荐帖子
2条评论
6条评论
7条评论