热线电话:13121318867

登录
2019-03-07 阅读量: 1722
平均值填充缺失值有哪些特点?

问、平均值填充缺失值有哪些特点?

答:

将初始数据集中的属性分为数值属性和非数值属性来分别进行处理。

数值型:根据该属性在其他所有对象的取值的平均值来填充该缺失的属性值;

非数值型的:根据统计学中的众数原理,用该属性在其他所有对象的取值次数最多的值(即填充法(出现频率最高的值)来补齐该缺失的属性值。

相似的还有一种方法叫条件平均值( Conditional Mean Completer ),在该方法中,用于求平均的值并不是从数据集的所有对象中取,而是从与该对象具有相同决策属性值的对象中取得。 这两种数据的补齐方法,其基本的出发点都是一样的,以最大概率可能的取值来补充缺失的属性值,只是在具体方法上有一点不同。

优点:简单易操作;

缺点:改变了数据的分布,而且有的优化问题会对方差优化,这样会让对方差优化问题变得不准确。

10.7653
1
关注作者
收藏
评论(0)

发表评论

暂无数据
推荐帖子