田齐齐

2020-03-18   阅读量: 3441

数据分析师 机器学习

机器学习:先进性归一化处理还是先拆分数据集

扫码加入数据分析学习群

需要先进行训练集和测试集的拆分, 然后才能进行归一化

原因: 测试集是为了评估模型的在未知数据中的表现情况, 归一化的过程, 也是我们建模中的一步, 如果说将测试集也放到归一化模型的训练过程当中, 那么就等于说我们的模型接触到了测试集的信息。这种情况称为数据泄露, 在建模过程当中是不允许的。

添加CDA认证专家【维克多阿涛】,微信号:【cdashijiazhuang】,提供数据分析指导及CDA考试秘籍。已助千人通过CDA数字化人才认证。欢迎交流,共同成长!
2.4637 4 3 关注作者 收藏

评论(1)

田齐齐
2020-03-21
空值填补同理
0.0000 0 0 回复

推荐课程