2019-03-06
阅读量:
1129
缺失值处理方法有哪些?
问、缺失值处理方法有哪些?
答:
处理不完整数据集的方法主要有三大类:删除元组、数据补齐、不处理。
a、删除元组
b、数据补齐
1、人工填写(filling manually):小数据使用
2、特殊值填充(Treating Missing Attribute values as Special values):不推荐
3、平均值填充(Mean/Mode Completer)数值型:平均值填充
非数值型:出现频率最高的值填充(众数)
4、热卡填充(Hot deck imputation,或就近补齐)
5、K最近距离邻法(K-means clustering)加权平均估计该样本的缺失数据
6、组合完整化方法(Combinatorial Completer)
7、回归(Regression)
8、期望值最大化方法(Expectation maximization,EM)
9、多重填补(Multiple Imputation,MI,又称M-试探法)
10、 C4.5方法






评论(0)


暂无数据
推荐帖子
0条评论
0条评论
0条评论