热线电话:13121318867

登录
2018-12-09 阅读量: 867
在构建估算器之前输入缺失值

此示例显示,丢弃缺失值可以提供比丢弃包含任何缺失值的样本更好的结果。输入并不总能改善预测,因此请通过交叉验证进行检查。有时丢弃行或使用标记值更有效。

缺失值可以使用基本值替换为均值,中值或最常值sklearn.impute.SimpleImputer。对于具有高幅度变量的数据,中值是更稳健的估计,其可以支配结果(否则称为“长尾”)。

除了使用估算方法之外,我们还可以使用sklearn.impute.MissingIndicator可能携带某些信息的缺失信息的指示。

../_images/sphx_glr_plot_missing_values_001.png

0.0000
2
关注作者
收藏
评论(0)

发表评论

暂无数据
推荐帖子