热线电话:13121318867

登录
2019-03-06 阅读量: 1129
缺失值处理方法有哪些?

问、缺失值处理方法有哪些?

答:

处理不完整数据集的方法主要有三大类:删除元组、数据补齐、不处理。

a、删除元组

b、数据补齐

1、人工填写(filling manually):小数据使用

2、特殊值填充(Treating Missing Attribute values as Special values):不推荐

3、平均值填充(Mean/Mode Completer)数值型:平均值填充

非数值型:出现频率最高的值填充(众数)

4、热卡填充(Hot deck imputation,或就近补齐)

5、K最近距离邻法(K-means clustering)加权平均估计该样本的缺失数据

6、组合完整化方法(Combinatorial Completer)

7、回归(Regression)

8、期望值最大化方法(Expectation maximization,EM)

9、多重填补(Multiple Imputation,MI,又称M-试探法)

10、 C4.5方法

0.0000
0
关注作者
收藏
评论(0)

发表评论

暂无数据
推荐帖子