热线电话:13121318867

登录
2020-10-20 阅读量: 782
随机森林和GBDT的区别
  1. 1.随机森林采用的bagging思想,而GBDT采用的boosting思想。这两种方法都是Bootstrap思想的应用,Bootstrap是一种有放回的抽样方法思想。虽然都是有放回的抽样,但二者的区别在于:Bagging采用有放回的均匀取样,而Boosting根据错误率来取样(Boosting初始化时对每一个训练样例赋相等的权重1/n,然后用该算法对训练集训练t轮,每次训练后,对训练失败的样例赋以较大的权重),因此Boosting的分类精度要优于Bagging。Bagging的训练集的选择是随机的,各训练集之间相互独立,弱分类器可并行,而Boosting的训练集的选择与前一轮的学习结果有关,是串行的。


  2. 2.组成随机森林的树可以是分类树,也可以是回归树;而GBDT只能由回归树组成。


  3. 3.组成随机森林的树可以并行生成;而GBDT只能是串行生成。


  4. 4.对于最终的输出结果而言,随机森林采用多数投票等;而GBDT则是将所有结果累加起来,或者加权累加起来。


  5. 5.随机森林对异常值不敏感;GBDT对异常值非常敏感。


  6. 6.随机森林对训练集一视同仁;GBDT是基于权值的弱分类器的集成。


  7. 7.随机森林是通过减少模型方差提高性能;GBDT是通过减少模型偏差提高性能。


44.7581
0
关注作者
收藏
评论(0)

发表评论

暂无数据