热线电话:13121318867

登录
2020-04-30 阅读量: 1062
简述数据清洗的主要几个步骤?

第一步:读入数据;

第二步:预览数据;

第三步:统计每一列的空值;

第四步:填充空值

第五步:特征工程,详细步骤包括:删除一些特征列;创建新的特征列;创建数据分箱;

第六步:对分类列编码,常用的包括,调用 Sklearn 中 LabelEncode 编码 ;Pandas 中哑编码;

第七步:再验证核实

0.0000
3
关注作者
收藏
评论(0)

发表评论

暂无数据
推荐帖子