京公网安备 11010802034615号
经营许可证编号:京B2-20210330
SPSS非参数检验:独立样本
一、概念:
独立样本的非参数检验是在对总体分布不甚了解的情况下,通过对两组或多组独立样本的分析来推断样本来自的总体的分布等是否存在显著差异的方法。独立样本是指在一个总体中随机抽样对在另一个总体中随机抽样没有影响的情况下所获得的样本。
二、选择检验(分析-非参数检验-独立样本-设置-选择检验)
1、根据数据自动选择检验。该设置将对具有两个组的数据应用Mann-Whitney U检验,或对具有k个组的数据应用Kruskal-Wallis单因素ANOVA检验。
2、自定义检验。这些设置允许您选择要执行的特定检验。
2.1、比较不同组间的分布。这些将生成独立样本检验,即样本是否来自同一总体。◎Mann-Whitney U(二样本)使用每个个案的秩来检验组是否抽取自同一总体。分组字段中按升序排列的第一个值定义第一个组,第二个值定义第二个组。如果分组字段有两个以上的值,则不生成此检验。◎Kolmogorov-Smirnov(二样本)对两个分布间中位数、离散、偏度等的任何差异很敏感。如果分组字段有两个以上的值,则不生成此检验。◎检验随机序列(二样本Wald-Wolfowitz)生成一个以组成员关系为准则的游程检验。如果分组字段有两个以上的值,则不生成此检验。◎Kruskal-Wallis单因素ANOVA(k样本)是Mann-Whitney U检验的扩展,它也是单因素方差分析的非参数模拟。您可以根据需要请求对k样本的多重比较,即所有成对多重比较或逐步降低比较。◎有序选项检验(k样本Jonckheere-Terpstra)可作为比Kruskal-Wallis功能更强大的选项,但前提是k样本需具有自然顺序。例如,k个总体可能代表k个上升的温度。“不同的温度产生相同的响应分布”这一假设是针对“温度升高,则响应的幅度增加”这一选择进行检验的。此处备选假设已排序,因此,Jonckheere-Terpstra是最适用的检验。指定其他假设的顺序;从最小到最大规定其他假设:第一组的位置参数不等于第二组,第二组又不等于第三组,依此类推;从最大到最小规定其他假设:最后一组的位置参数不等于倒数第二组,倒数第二组又不等于倒数第三组,依此类推。您可以根据需要请求对k样本的多重比较,即所有成对多重比较或逐步降低比较。
2.2、比较不同组间的范围。这可以生成一个独立样本检验,即样本是否具有相同范围。◎Moses极端反应(二样本)检验控制组与比较组。分组字段中按升序排列的第一个值定义控制组,第二个值定义比较组。如果分组字段有两个以上的值,则不生成此检验。
2.3、比较不同组间的中位数。这可以生成一个独立样本检验,即样本是否具有相同中位数。◎中位数检验(k样本)可以使用汇聚样本中位数(从数据集所有记录中计算)或自定义值作为假设中位数。您可以根据需要请求对k样本的多重比较,即所有成对多重比较或逐步降低比较。
2.4、估计不同组间的置信区间。Hodges-Lehman估计(二样本)可以为两个组的中位数差异生成一个独立样本估计和置信区间。如果分组字段有两个以上的值,则不生成此检验。
三、方法:
1、曼-惠特尼U检验:两独立样本的曼-惠特尼U检验可用于对两总体分布的比例判断。其原假设:两组独立样本来自的两总体分布无显著差异。曼-惠特尼U检验通过对两组样本平均秩的研究来实现判断。秩简单说就是变量值排序的名次,可以将数据按升序排列,每个变量值都会有一个在整个变量值序列中的位置或名次,这个位置或名次就是变量值的秩。
2、K-S检验:K-S检验不仅能够检验单个总体是否服从某一理论分布,还能够检验两总体分布是否存在显著差异。其原假设是:两组独立样本来自的两总体的分布无显著差异。这里是以变量值的秩作为分析对象,而非变量值本身。
3、游程检验:单样本游程检验是用来检验变量值的出现是否随机,而两独立变量的游程检验则是用来检验两独立样本来自的两总体的分布是否存在显著差异。其原假设是:两组独立样本来自的两总体的分布无显著差异。两独立样本的游程检验与单样本游程检验的思想基本相同,不同的是计算游程数的方法。两独立样本的游程检验中,游程数依赖于变量的秩。
4、极端反应检验:极端反应检验从另一个角度检验两独立样本所来自的两总体分布是否存在显著差异。其原假设是:两独立样本来自的两总体的分布无显著差异。
基本思想是:将一组样本作为控制样本,另一组样本作为实验样本。以控制样本作为对照,检验实验样本相对于控制样本是否出现了极端反应。如果实验样本没有出现极端反应,则认为两总体分布无显著差异,相反则认为存在显著差异。
5、中位数检验:中位数检验通过对多组独立样本的分析,检验它们来自的总体的中位数是否存在显著差异。其原假设是:多个独立样本来自的多个总体的中位数无显著差异。
基本思想是:如果多个总体的中位数无显著差异,或者说多个总体有共同的中位数,那么这个共同的中位数应在各样本组中均处在中间位置上。于是,每组样本中大于该中位数或小于该中位数的样本数目应大致相同。
6、Kruskal-Wallis检验:Kruskal-Wallis检验实质是两独立样本的曼-惠特尼U检验在多个样本下的推广,也用于检验多个总体的分布是否存在显著差异。其原假设是:多个独立样本来自的多个总体的分布无显著差异。
基本思想是:首先,将多组样本数据混合并按升序排序,求出各变量值的秩;然后,考察各组秩的均值是否存在显著差异。容易理解:如果各组秩的均值不存在显著差异,则是多组数据充分混合,数值相差不大的结果,可以认为多个总体的分布无显著差异;反之,如果各组秩的均值存在显著差异,则是多组数据无法混合,某些组的数值普遍偏大,另一些组的数值普遍偏小的结果,可以认为多个总体的分布有显著差异。
7、Jonckheere-Terpstra检验:Jonckheere-Terpstra检验也是用于检验多个独立样本来自的多个总体的分布是否存在显著差异的非参数检验方法,其原假设是:多个独立样本来自的多个总体的分布无显著差异。
基本思想与两独立样本的曼-惠特尼U检验类似,也是计算一组样本的观察值小于其他组样本的观察值的个数。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在当下数据驱动决策的职场环境中,A/B测试早已成为互联网产品、运营、营销乃至产品迭代优化的核心手段,小到一个按钮的颜色、文 ...
2026-03-24在统计学数据分析中,尤其是分类数据的分析场景里,卡方检验和显著性检验是两个高频出现的概念,很多初学者甚至有一定统计基础的 ...
2026-03-24在CDA(Certified Data Analyst)数据分析师的日常业务分析与统计建模工作中,多组数据差异对比是高频且核心的分析场景。比如验 ...
2026-03-24日常用Excel做数据管理、台账维护、报表整理时,添加备注列是高频操作——用来标注异常、说明业务背景、记录处理进度、补充关键 ...
2026-03-23作为业内主流的自助式数据可视化工具,Tableau凭借拖拽式操作、强大的数据联动能力、灵活的仪表板搭建,成为数据分析师、业务人 ...
2026-03-23在CDA(Certified Data Analyst)数据分析师的日常工作与认证考核中,分类变量的关联分析是高频核心场景。用户性别是否影响商品 ...
2026-03-23在数据工作的全流程中,数据清洗是最基础、最耗时,同时也是最关键的核心环节,无论后续是做常规数据分析、可视化报表,还是开展 ...
2026-03-20在大数据与数据驱动决策的当下,“数据分析”与“数据挖掘”是高频出现的两个核心概念,也是很多职场人、入门学习者容易混淆的术 ...
2026-03-20在CDA(Certified Data Analyst)数据分析师的全流程工作闭环中,统计制图是连接严谨统计分析与高效业务沟通的关键纽带,更是CDA ...
2026-03-20在MySQL数据库优化中,分区表是处理海量数据的核心手段——通过将大表按分区键(如时间、地域、ID范围)分割为多个独立的小分区 ...
2026-03-19在商业智能与数据可视化领域,同比、环比增长率是分析数据变化趋势的核心指标——同比(YoY)聚焦“长期趋势”,通过当前周期与 ...
2026-03-19在数据分析与建模领域,流传着一句行业共识:“数据决定上限,特征决定下限”。对CDA(Certified Data Analyst)数据分析师而言 ...
2026-03-19机器学习算法工程的核心价值,在于将理论算法转化为可落地、可复用、高可靠的工程化解决方案,解决实际业务中的痛点问题。不同于 ...
2026-03-18在动态系统状态估计与目标跟踪领域,高精度、高鲁棒性的状态感知是机器人导航、自动驾驶、工业控制、目标检测等场景的核心需求。 ...
2026-03-18“垃圾数据进,垃圾结果出”,这是数据分析领域的黄金法则,更是CDA(Certified Data Analyst)数据分析师日常工作中时刻恪守的 ...
2026-03-18在机器学习建模中,决策树模型因其结构直观、易于理解、无需复杂数据预处理等优势,成为分类与回归任务的首选工具之一。而变量重 ...
2026-03-17在数据分析中,卡方检验是一类基于卡方分布的假设检验方法,核心用于分析分类变量之间的关联关系或实际观测分布与理论期望分布的 ...
2026-03-17在数字化转型的浪潮中,企业积累的数据日益庞大且分散——用户数据散落在注册系统、APP日志、客服记录中,订单数据分散在交易平 ...
2026-03-17在数字化时代,数据分析已成为企业决策、业务优化、增长突破的核心支撑,从数据仓库搭建(如维度表与事实表的设计)、数据采集清 ...
2026-03-16在数据仓库建设、数据分析(尤其是用户行为分析、业务指标分析)的实践中,维度表与事实表是两大核心组件,二者相互依存、缺一不 ...
2026-03-16