热线电话:13121318867

登录
2020-03-31 阅读量: 961
bagging抽样,为什么有1/3的噪声样本不会被训练?

一般来说,自助集大约平均会包含63%的原始数据。因为每一个样本被抽到某个自助集中的概率为

当n足够大时,这个概率收敛于1-(1/e),约等于0.632。因此,会有约37%的训练数据被浪费掉,没有参与建模, 这些数据被称为袋外数据(out of bag data,简写为oob)。

12.3516
0
关注作者
收藏
评论(0)

发表评论

暂无数据
推荐帖子