热线电话:13121318867

登录
2020-12-19 阅读量: 541
查找异常值和重复值的时候,当时都是以一列数据作为举例子,那么后期再工作时,是每一列数据都要单独进行异常值/重复值/缺失值的处理吗?一列一列进行的话,那如果数据的列数比较多的话该怎么办

重复值一般是按行来统计的,也就是两行数据完全一样才进行删除,异常值是对每一列看的,通常就是箱线图

拿到数据可以先看整体的信息,比如describe(),看下大概的数据布情况,然后对比较异常的进行处理


47.7593
0
关注作者
收藏
评论(0)

发表评论

暂无数据
推荐帖子