2019-03-15
阅读量:
620
异常值如何处理?
问题描述:
像政府那些数据,即使有3倍外的异常值也要处理吗?处理的方法怎么选择?
答案解析:
要处理,方法如下:
1. 盖帽法(推荐)
整行替换数据框里99%以上和1%以下的点,将99%以上的点值=99%的点值;小于1%的点值=1%的点值,即替换成3倍标准差容忍值最大的值
2. 分箱法(推荐)
将连续变量等级化之后,不同的分位数的数据就会变成不同的等级数据,连续变量离散化了,消除了极值的影响。
3. 均值替换法






评论(0)


暂无数据
推荐帖子
0条评论
0条评论
1条评论