2021-05-20
阅读量:
464
提问:n_estimators份采样集怎么做?
需要做n_estimators份采样集, 可以尝试使用dataframe的形式帮助做(效率低)
# 首先将训练集的特征和标签拼在一起,因为做采样的时候,样本的特征和标签都同时来做采样
train = pd.DataFrame(Xtrain)
train['label'] = Ytrain
data_train_ = []
for i in range(n_estimators):
# 每次循环的过程中,使用dataframe.sample这个函数来进行有放回的随机采样
# 生成采样集,这个采样集是小dataframe,有特征和标签
sub = train.sample(frac = 0.9, replace = True)
# 分开特征和标签,做成一个小元组追要空list当中
sub_X, sub_Y = sub.iloc[:, :-1], sub.iloc[:, -1]
data_train_.append((sub_X, sub_Y))






评论(0)


暂无数据
推荐帖子
0条评论
0条评论
1条评论