热线电话:13121318867

登录
2020-04-29 阅读量: 991
为什么要用随机森林填补缺失值?

要用随机森林填补缺失值的原因总结如下:

1.在与其它现有的算法相比,其预测准确率很好

2.在较大的数据集上计算速度依然很快

3.不需要降维,算法本身是采取随机降维的

4.他能处理有缺失值的数据集。算法内部有补缺失值的函数

5.能给出变量的重要性

6.能处理imbalanced data set

7.能给出观测实例间的相似度矩阵,其实就是proximity啦,继而能做clustering 和 location outlier

8.能对unlabeled data 进行无监督的学习,进行clustering

9.生成的森林可以保留,应用在新的数据集上

21.0654
6
关注作者
收藏
评论(0)

发表评论

暂无数据
推荐帖子