登录
首页大数据时代假设检验应该遵循什么样的步骤?它的方法有哪些?
假设检验应该遵循什么样的步骤?它的方法有哪些?
2020-07-07
收藏

假设检验是根据一定的假设条件,由样本推断总体的一种方法。

假设检验问题是统计推断中的一类重要问题,在总体的分布函数完全未知或只知其形式,不知其参数的情况,为了推断总体的某些未知特性,提出某些关于总体的假设,这类问题被称为假设检验

1.假设检验步骤

一个假设检验问题可以分为5步,无论细节如果变化,都一定会遵循这5个步骤。

陈述研究假设,包含原假设(null hypothesis)和备择假设(alternate hypothesis)

通常来说,我们会把原假设的描述写成变量之间不存在某种差异,或不存在某种关联,原假设是被保护的假设, 如果没有确凿的证据不能推翻。备择假设则为存在某种差异或关联。例如,原假设:男人和女人的平均身高没有差别, 备择假设男人和女人的平均身高存在显著差别。

为验证假设收集数据

为了统计检验的结果真实可靠,需要根据实际的假设命题从总体中抽取样本,要求抽样的数据要具有代表性,例如在上述男女平均身高的命题中,抽取的样本要能覆盖到各类社会阶级,各个国家等所有可能影响到身高的因素。

构造合适的统计测试量并测试

统计检验量有很多种类,但是所有的统计检验都是基于组内方差和组间方差的比较,如果组间方差足够大,使得不同组之间几乎没有重叠,那么统计量会反映出一个非常小的P值,意味着不同组之间的差异不可能是由偶然性导致的。

决定是接受还是拒绝原假设

基于统计量的结果做出接受或拒绝原假设的判断,通常我们会以P=0.05作为临界值(单侧检验)。

2.假设检验的四种方法

1、有关平均值参数u的假设检验

根据是否已知方差,分为两类检验:U检验和T检验。

如果已知方差,则使用U检验,如果方差未知则采取T检验。

2、有关参数方差σ2的假设检验

F检验是对两个正态分布的方差齐性检验,简单来说,就是检验两个分布的方差是否相等

3、检验两个或多个变量之间是否关联

卡方检验属于非参数检验,主要是比较两个及两个以上样本率(构成比)以及两个分类变量的关联性分析。根本思想在于比较理论频数和实际频数的吻合程度或者拟合优度问题。

数据分析咨询请扫描二维码

客服在线
立即咨询