热线电话:13121318867

登录
2020-03-31 阅读量: 540
boostrap得到的自助集是相互独立的吗?

随机森林算法中要让基分类器尽量都不一样,一种很容易理解的方法是使用不同的训练集来进行训练,袋装法正是通过有放回的随机抽样技术来形成不同的训练数据, bootstrap就是用来控制抽样技术的参数。

boostrap抽样方法就是在一个含有n个样本的原始训练集中,我们进行随机采样,每次采样一个样本,并在抽取下一个样本之前将该样本放回原始训练集,也就是说下次采样时这个样本依然可能被采集到,这样采集n次,最终得到一个和原始训练集一样大的, n个样本组成的自助集。由于是随机采样,这样每次的自助集和原始数据集不同,和其他的采样集也是不同的。这样我们就可以自由创造取之不尽用之不竭,并且互不相同的自助集,这些自助集在统计意义上是相互独立的

8.3195
4
关注作者
收藏
评论(0)

发表评论

暂无数据
推荐帖子