热线电话:13121318867

登录
2019-03-15 阅读量: 620
异常值如何处理?

问题描述:

像政府那些数据,即使有3倍外的异常值也要处理吗?处理的方法怎么选择?

答案解析:

要处理,方法如下:

1. 盖帽法(推荐)

整行替换数据框里99%以上和1%以下的点,将99%以上的点值=99%的点值;小于1%的点值=1%的点值,即替换成3倍标准差容忍值最大的值

2. 分箱法(推荐)

将连续变量等级化之后,不同的分位数的数据就会变成不同的等级数据,连续变量离散化了,消除了极值的影响。

3. 均值替换法

0.0000
1
关注作者
收藏
评论(0)

发表评论

暂无数据
推荐帖子