2020-02-24
阅读量:
767
随机森林怎么避免出现某个y值太大?
如果使用随机森林预测连续性变量可以使用回归树,在回归树中,训练数据中叶子节点得到的值是该区域内观测值的平均响应值。因此,如果一个数据观测值落在那个区域(叶子节点),我们将用这个区域内所有观测值的平均值作为它的预测值。
因为大型的树倾向于受影响,导致低偏差(过度拟合)或高方差(极度不拟合)。不过如果我们生成大量的树,最终的预测值采用集成所有树产生的输出的平均值,就可以避免方差的问题。y的大小已经平均了,有利于得到好的预测结果。






评论(0)


暂无数据
推荐帖子
0条评论
0条评论
0条评论