小风醉

2022-07-31   阅读量: 792

统计学

样本方差为什么除以n-1

扫码加入数据分析学习群

为了保持标准偏差的无偏性。换句话说,除以(n-1)后,样本标准偏差的期望 = 总体的标准差.是无偏估计。但除以n后,样本标准差的期望 不等于 总体的标准差.是有偏估计。

一、在容量为N的总体中,假设我们已经通过随机抽样的方式获得了一份容量为n的样本数据。现在我们有两个任务需要完成:一是归纳样本本身这n个数据之间的分布状况;二是借助该样本来推测总体的分布状况,亦即尝试以局部推测总体、以偏概全。

二、出于简便的考虑,我们经常仅仅借助均值和方差这两个指标来简略地描述样本或总体的分布状况。则对于第一项任务而言,为准确描述样本数据间的离散程度,样本方差计算公式中的除数应为"n”。类似地,为准确描述总体数据间的离散程度,总体方差计算公式中的除数应为"N”。

三、然而,如果我们准备借助样本方差来推测总体的方差,则可以证明:以"n”为除数的样本方差计算公式不是总体方差的无偏估计值计算式,而只有以"n-1”为除数的样本方差计算公式才是总体方差的无偏估计值计算式。因此在推断统计领域,样本方差计算式的除数应为"n-1”,而不应为"n”。

当然,在n足够大的时候,样本方差这两种计算方法之间的差异可以忽略不计。

四、最后,我将上述阐述归纳如下:

1. 设若总体数据已知,则该总体的数字特征不存在推测的问题,只存在描述的问题,是故总体方差计算公式中的除数应为"N”。

2. 以"n-1”为除数的样本方差计算公式是总体方差的无偏估计值计算式。

3. 以"n”为除数的样本方差计算公式是总体方差的渐近无偏估计值计算式。

4. 如果只是要描述样本数据间的离散程度,则样本方差计算公式中的除数应为"n”。

5. 当n足够大的时候,不必太在意样本方差计算公式中除数的这两种不同的选择。

6. 在多数场合,习惯上总是采用以"n-1”为除数的样本方差计算方式。


添加CDA认证专家【维克多阿涛】,微信号:【cdashijiazhuang】,提供数据分析指导及CDA考试秘籍。已助千人通过CDA数字化人才认证。欢迎交流,共同成长!
56.9332 1 0 关注作者 收藏

评论(0)


暂无数据

推荐课程

推荐帖子