2020-03-25
阅读量:
3179
为什么先划分训练集和测试集后归一化?
先对数据划分训练集和测试集后归一化和对数据归一化后划分测试集和训练集,两者的区别:
理论上还是应该先划分数据集,然后对训练数据做预处理,并且保存预处理的参数,在用同样的参数处理测试集。
因为划分训练集和测试集就是假设只知道训练集的信息,而认为测试集数据是来自未来的,不可得知。如果之前统一做预处理之后再划分的话就利用了测试集的信息。






评论(0)


暂无数据
推荐帖子
0条评论
0条评论
0条评论