2019-03-07
阅读量:
1722
平均值填充缺失值有哪些特点?
问、平均值填充缺失值有哪些特点?
答:
将初始数据集中的属性分为数值属性和非数值属性来分别进行处理。
•数值型:根据该属性在其他所有对象的取值的平均值来填充该缺失的属性值;
•非数值型的:根据统计学中的众数原理,用该属性在其他所有对象的取值次数最多的值(即填充法(出现频率最高的值)来补齐该缺失的属性值。
相似的还有一种方法叫条件平均值( Conditional Mean Completer ),在该方法中,用于求平均的值并不是从数据集的所有对象中取,而是从与该对象具有相同决策属性值的对象中取得。 这两种数据的补齐方法,其基本的出发点都是一样的,以最大概率可能的取值来补充缺失的属性值,只是在具体方法上有一点不同。
优点:简单易操作;
缺点:改变了数据的分布,而且有的优化问题会对方差优化,这样会让对方差优化问题变得不准确。






评论(0)


暂无数据
推荐帖子
0条评论
0条评论
0条评论