热线电话:13121318867

登录
2020-09-16 阅读量: 1366
机器学习中训练集及测试集的拆分总结

问:

机器学习中训练集及测试集的拆分总结


答:

训练集测试集的拆分是机器学习中的重要步骤之一。这一步非常重要,因为您需要在部署模型之前先对其进行评估,同时该评估需要针对全新的数据进行,因为在部署数据时,所有传入的数据都是全新的。

训练集测试集拆分的的主要思想是将原始数据集转换为2部分

  • 训练

  • 测试

训练集由训练数据和训练标签组成,而测试集由测试数据和测试标签组成。

最简单的方法是使用 scikit-learn,它提供了内置函数 train_test_split。让我们来编写代码吧。

from sklearn.model_selection import train_test_split

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.2)


在这里,我们将 Xy作为参数传入train_test_split,按照测试集20%和验证集80%的比例,将数据分成X_trainX_testy_trainy_test

37.4872
0
关注作者
收藏
评论(0)

发表评论

暂无数据
推荐帖子