2020-09-16
阅读量:
1366
机器学习中训练集及测试集的拆分总结
问:
机器学习中训练集及测试集的拆分总结
答:
训练集测试集的拆分是机器学习中的重要步骤之一。这一步非常重要,因为您需要在部署模型之前先对其进行评估,同时该评估需要针对全新的数据进行,因为在部署数据时,所有传入的数据都是全新的。
训练集测试集拆分的的主要思想是将原始数据集转换为2部分
训练
测试
训练集由训练数据和训练标签组成,而测试集由测试数据和测试标签组成。
最简单的方法是使用 scikit-learn,它提供了内置函数 train_test_split。让我们来编写代码吧。
from sklearn.model_selection import train_test_split X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.2)
在这里,我们将 X 和 y作为参数传入train_test_split,按照测试集20%和验证集80%的比例,将数据分成X_train,X_test,y_train和y_test。






评论(0)


暂无数据
推荐帖子
0条评论
0条评论
0条评论