shauna570392

2021-04-21   阅读量: 1640

上下边缘的计算为什么用1.5*IQR?​

扫码加入数据分析学习群

这里IQR指的是四分位距,如果我们把数据集当成是服从正态分布的数据集,那么上下边缘的计算公式中的系数取1.5倍四分位距时,上边缘与下边缘这段区间的概率分布为99.3%,也就是说只有1%的数可能会落在这个区间之外,是非常小的概率, 如果出现了这种情况,我们就可以认为这个数据的出现是会伴随着某些问题的出现,也就是为什么在这个区间之外的点我们称为异常点。

150.0000 1 0 关注作者 收藏

评论(0)


暂无数据

推荐课程