申宗康

2022-02-11   阅读量: 533

统计学

随机森林

扫码加入数据分析学习群

随机森林(Random Forest)是一种组合预测模型,顾名思义随机森林是用随机方式建立一片森林,森林中包含众多有较高预测精度且弱相关,甚至不相关的决策树并且成组合预测模型。在随机森林算法模型中的每一棵决策树中,彼此之间并没有联系。在建立好森林模型之后,每当出现新的空气数据输入样本时,森林模型中的每一棵决策树便各自独立进行判断。

随机森林可以出来高维度(特征很多)的数据,并且不用降维,无需做特征选择;随机森林可以判断特征的重要程度;可以判断出不同特征之间的相互影响;不容易过拟合;训练速度比较快,容易做成并行方法;实现起来比较简单;对于不平衡的数据集来说,随机森林可以平衡误差;如果有很大一部分的特征遗失,随机森林仍可以维持准确度

添加CDA认证专家【维克多阿涛】,微信号:【cdashijiazhuang】,提供数据分析指导及CDA考试秘籍。已助千人通过CDA数字化人才认证。欢迎交流,共同成长!
18.0116 3 0 关注作者 收藏

评论(0)


暂无数据

推荐课程

推荐帖子