扫码加入数据分析学习群
随机森林的利弊
优点如下:
- 它对相关预测变量具有鲁棒性。
- 它用于解决回归和分类问题。
- 它也可以用于解决无监督的ML问题。
- 它可以处理数千个输入变量而无需变量选择。
- 它可以用作使用其变量重要性图的特征选择工具。
- 它以有效的方式内部处理缺失的数据。
缺点如下:
- 随机森林模型很难解释。
- 它倾向于返回超出训练数据范围的观察的不稳定预测。 例如,训练数据包含两个变量x和y。 x变量的范围是30到70.如果测试数据的x = 200,则随机森林将给出不可靠的预测。
- 计算大量树木所需的时间可能比预期的要长。
添加CDA认证专家【维克多阿涛】,微信号:【cdashijiazhuang】,提供数据分析指导及CDA考试秘籍。已助千人通过CDA数字化人才认证。欢迎交流,共同成长!
评论(0)
暂无数据