热线电话:13121318867

登录
2020-07-20 阅读量: 932
python:如果一个特征是连续性变量,那对变量进行空缺值填补和编码操作是在切分数据集之前还是之后

问题:如果一个特征是连续性变量,那对变量进行空缺值填补和编码操作是在切分数据集之前还是之后

解答:

最严格的方法应该是在切分之后做。

如果先填充空缺值,然后做编码,全部做好之后再切分的,这个方法是不严谨的方法。最严谨的方法是要先切分再做空缺值的填充与编码。

我们直接使用sklearn的包来帮助我们很简便的实现,先切分数据集,再做处理的代码。

40.1195
5
关注作者
收藏
评论(0)

发表评论

暂无数据
推荐帖子