2020-03-31
阅读量:
961
bagging抽样,为什么有1/3的噪声样本不会被训练?
一般来说,自助集大约平均会包含63%的原始数据。因为每一个样本被抽到某个自助集中的概率为

当n足够大时,这个概率收敛于1-(1/e),约等于0.632。因此,会有约37%的训练数据被浪费掉,没有参与建模, 这些数据被称为袋外数据(out of bag data,简写为oob)。






评论(0)


暂无数据
推荐帖子
0条评论
0条评论
0条评论