热线电话:13121318867

登录
2022-03-08 阅读量: 829
统计学习——卡方分布

为什么从正态总体中抽取出的样本的方差服从卡方分布?

若n个相互独立的随机变量ξ,ξ,...,ξn ,均服从标准正态分布(也称独立同分布于标准正态分布),则这n个服从标准正态分布的随机变量的平方和构成一新的随机变量,其分布规律称为卡方分布(chi-square distribution)。

分布在数理统计中具有重要意义。

分布是由阿贝(Abbe)于1863年首先提出的,后来由海尔墨特(Hermert)和现代统计学的奠基人之一的卡·皮尔逊(C K.Pearson)分别于1875年和1900年推导出来,是统计学中的一个非常有用的著名分布。

分布不像正态分布那样将所有正态分布的查表都转化为标准正态分布去查,在卡方分布中得对每个分布编制相应的概率值,这通过卡方分布表中列出不同的自由度来表示,在卡方分布表中还需要如标准正态分布表中给出不同 P 值一样,列出概率值,只不过这里的概率值是 值以上卡方分布曲线以下的概率。由于 分布概率表中要列出很多 分布的概率值,所以 分布中所给出的P 值就不像标准正态分布中那样给出了400个不同的 P 值,而只给出了有代表性的13个值,因此卡方分布概率表的精度就更差,不过给出了常用的几个值,足够在实际中使用了。

查卡方分布概率表时,按自由度及相应的概率去找到对应的x平方值。如图《卡方分布临界值表》所示的单侧概率 0.05(7)=14.1的查表方法就是,在第一列找到自由度7这一行,在第一行中找到概率0.05这一列,行列的交叉处即是14.1。

表中所给值直接只能查单侧概率值,可以变化一下来查双侧概率值。例如,要在自由度为7的卡方分布中,得到双侧概率为0.05所对应的上下端点可以这样来考虑:双侧概率指的是在上端和下端各划出概率相等的一部分,两概率之和为给定的概率值,这里是0.05,因此实际上上端点以上的概率为0.05/2=0.025,用概率0.025查表得上端点的值为16,记为 0.05/2(7)=16。下端点以下的概率也为0.025,因此可以用0.975查得下端点为1.69,记为 1-0.05/2(7)=1.69。

当然也可以按自由度及x平方值去查对应的概率值,不过这往往只能得到一个大概的结果,因为卡方分布概率表的精度有限,只给了 13 个不同的概率值进行查表。例如,要在自由度为 18 的 分布查找 =30 对应的概率,则先在第一列找到自由度18,然后看这一行可以发现与 30 接近的有28.9与31.5,它们所在的列是0.05与0.025,所以要查的概率值应于介于0.05与0.025之间,当然这是单侧概率值,它们的双侧概率值界于0.1与0.05之间。如果要更精确一些可以采用插值的方法得到,这在正态分布的查表中有介绍。



300.3570
0
关注作者
收藏
评论(0)

发表评论

暂无数据