热线电话:13121318867

登录
2020-02-24 阅读量: 767
随机森林怎么避免出现某个y值太大?

如果使用随机森林预测连续性变量可以使用回归树,在回归树中,训练数据中叶子节点得到的值是该区域内观测值的平均响应值。因此,如果一个数据观测值落在那个区域(叶子节点),我们将用这个区域内所有观测值的平均值作为它的预测值。

因为大型的树倾向于受影响,导致低偏差(过度拟合)或高方差(极度不拟合)。不过如果我们生成大量的树,最终的预测值采用集成所有树产生的输出的平均值,就可以避免方差的问题。y的大小已经平均了,有利于得到好的预测结果。

0.0000
1
关注作者
收藏
评论(0)

发表评论

暂无数据
推荐帖子