2018-12-09
阅读量:
867
在构建估算器之前输入缺失值
此示例显示,丢弃缺失值可以提供比丢弃包含任何缺失值的样本更好的结果。输入并不总能改善预测,因此请通过交叉验证进行检查。有时丢弃行或使用标记值更有效。
缺失值可以使用基本值替换为均值,中值或最常值sklearn.impute.SimpleImputer
。对于具有高幅度变量的数据,中值是更稳健的估计,其可以支配结果(否则称为“长尾”)。
除了使用估算方法之外,我们还可以使用sklearn.impute.MissingIndicator
可能携带某些信息的缺失信息的指示。







评论(0)


暂无数据
推荐帖子
0条评论
0条评论
0条评论