cda

数字化人才认证

您的位置:首页 > 大数据时代 > 随机森林(Random Forest)算法的优点和缺点都有哪些?

随机森林(Random Forest)算法的优点和缺点都有哪些?

2020-07-09

随机森林(Random Forests)现在机器学习中比较火的一个算法,是一种基于Bagging的集成学习方法,能够很好地处理分类和回归的问题。下面小编整理了随机森林的优点和缺点,希望对大家有所帮助。

随机森林有许多优点:

1.准确率极高

2.能够有效地在大数据集上运行

3.引入了随机性,不容易过拟合

4. 随机森林有很好的抗噪声能力,但是在在数据噪音比较大的情况下会过拟合

5.能处理很高维度的数据,而且不用降维

6. 不仅能处理离散型数据,还能处理连续型数据,而且不需要将数据集规范化

7.训练速度快,能够得到变量重要性排序

8.容易实现并行化

9.即使对于缺省值问题也能够获得很好得结果

10.超参数的数量不是很多,并且都能很直观地了解它们多代表的含义

随机森林的缺点:

虽然随机森林算法已经足够快,但是当遇到随机森林中的决策树个数很多时,训练时所需要的空间和时间会会很大,这将导致模型越慢。因此在实际应用中,如果遇到实时性要求很高的情况,最好选择其他算法。

应用场景

随机森林(Random Forest,简称RF)拥有广泛的应用前景,从市场营销到医疗保健保险,既可以用来做市场营销模拟的建模,统计客户来源,保留和流失,也可用来预测疾病的风险和病患者的易感性。

完 谢谢观看

分享
收藏

OK