2020-04-29
阅读量:
991
为什么要用随机森林填补缺失值?
要用随机森林填补缺失值的原因总结如下:
1.在与其它现有的算法相比,其预测准确率很好
2.在较大的数据集上计算速度依然很快
3.不需要降维,算法本身是采取随机降维的
4.他能处理有缺失值的数据集。算法内部有补缺失值的函数
5.能给出变量的重要性
6.能处理imbalanced data set
7.能给出观测实例间的相似度矩阵,其实就是proximity啦,继而能做clustering 和 location outlier
8.能对unlabeled data 进行无监督的学习,进行clustering
9.生成的森林可以保留,应用在新的数据集上






评论(0)


暂无数据
推荐帖子
0条评论
0条评论
0条评论