热线电话:13121318867

登录
2020-05-17 阅读量: 1720
为什么要选随机森林来填补缺失值呢,为啥不用其他算法填补,随机森林填补的优缺点是什么?

采用随机森林对缺失数据进行填补,主要利用到随机森林在分类过程中对样本之间关系的出色的自动分析

随机森林缺失值填补的优点

  • 随机森林填补通过构造多棵决策树对缺失值进行填补,使得填补得到的数据具有随机性和不确定性,更能反映出这些未知数据的真实分布;
  • 随机森林填补由于在构造决策树过程中,每个分支节点选用随机的部分特征而不是全部特征,所以能很好的应用到高维数据的填补;
  • 随机森林算法本身就具有很好的分类精度,从而也更进一步确保了得到的填补值的准确性和可靠性。

缺点:

解释性比较差

43.2131
2
关注作者
收藏
评论(0)

发表评论

暂无数据
推荐帖子