2020-07-20
阅读量:
932
python:如果一个特征是连续性变量,那对变量进行空缺值填补和编码操作是在切分数据集之前还是之后
问题:如果一个特征是连续性变量,那对变量进行空缺值填补和编码操作是在切分数据集之前还是之后
解答:
最严格的方法应该是在切分之后做。
如果先填充空缺值,然后做编码,全部做好之后再切分的,这个方法是不严谨的方法。最严谨的方法是要先切分再做空缺值的填充与编码。
我们直接使用sklearn的包来帮助我们很简便的实现,先切分数据集,再做处理的代码。






评论(0)


暂无数据
推荐帖子
2条评论
0条评论
2条评论