
SPSS分析技术:两个独立样本的非参数检验
在医学类研究中,经常会遇到治疗效果无法量化,但需要比较不同治疗方法优劣的需求。例如,比较止痛药的效果,疼痛程度无法准确量化,只能用主观打分来描述;理疗复健方法的优劣也无法量化,只能通过病人的情况粗略划分成卧床,部分自主等层次。当遇到这样无法量化数据的比较要求时,应该如何进行比较呢?两个样本的非参数检验是合适的分析方法。下面将介绍两个独立样本的非参数检验方法。
两个独立样本的非参数检验
单个样本的非参数检验对比的是样本分布与已知分布,从而得出随机样本所代表的总体是否服从已知分布。两独立样本的非参数检验是对两个独立样本的分布情况直接进行对比,目的是获得关于两总体分布状况差异大小的信息。这与单个样本假设检验和两个样本假设检验是一个套路。
SPSS提供了4种检验方法:Mann-Whitney U检验(曼-惠特尼U检验)、K-S检验、Wald-Wolfowitz检验(随机序列检验)和Moses极端反应检验。它们的原假设都是两个样本来自的总体分布没有显著性差异,只不过它们的分析方法不同。
Mann-Whitney U检验
Mann-Whitney U检验又称Mann-Whitney秩和检验,可用于对两总体分布的比例判断。其原假设为:两个独立样本来自的两个总体的分布无显著差异。Mann-Whitney U检验通过对两组样本平均秩的研究来实现判断。
Mann-Whitney U检验原理:将两个样本混合后按升序排列,得到每个样本值的秩(排名),然后分别求得两组样本的平均秩,并对这两个平均秩进行比较。如果两个总体分布无显著差异,其秩应该差别不大,从而两组样本的平均秩差别较小;反之,若两总体差异显著,则二者的平均秩会有较大差异。此外,Mann-Whitney U检验还要计算样本A的秩大于样本B的秩的个数U1,以及样本B的秩优于A的秩的个数U2,如果总体分布无显著差异,则两者应该接近;反之,若两总体差异显著,则二者的平均秩会有较大差异。
两独立样本K-S检验
检验原理:首先将两独立样本的数据混合并按升序排列,然后分布计算两个独立样本秩的累计频率,并求得两个累计频率的差值序列数据以获得D统计量。SPSS将自动计算D统计量的概率P值,如果P值大于显著性水平,则接受原假设;反之,则拒绝原假设,即两个样本来自的总体分布差异显著。
两个独立样本Wald-Wolfowitz检验
将两组样本混合并升序排列。同时,两组样本的每个观测值对应的样本组标志值序列也将随之重新排序,求出此游程。如果所得游程数较小,说明两总体的分布差异较大;反之,则不存在显著性差异。同时SPSS将据此自动计算相伴概率P值,如果P值大于显著性水平临界值,则接受原假设;反之则拒绝原假设,即两个样本来自的总体分布差异显著。
两独立样本Moses极端反应检验
原理为:将一组样本作为控制样本;另一组作为比较样本。一般按升序排列的第一个值定义控制组,第二个值定义比较组。以控制组作为参照,检验比较组相对于控制组是否出现极端反应。为此,将两组样本混合并升序排列,求得控制样本最高秩次和最低秩次之间包含的观测值个数,即跨度,以及去掉两个极端值后的截头跨度。如果跨度和截头跨度都很小,说明比较样本可能存在极端反应,两总体的分布差异显著;如果比较样本没有出现极端反应,则两总体分布无显著差异。
范例分析
现在由一份运用药物治疗和物理治疗方法对中风患者治疗结果的数据,治疗结果被分成5各层次:正常、可以自主活动、部分肢体可以自主活动、卧床和无自理能力;总共记录了100位患者的治疗效果,需要分析两种治疗方法的结果是否有显著性差异。
分析步骤
1、选择菜单【分析】-【非参数检验】-【旧对话框】-【2个独立样本】,在跳出的对话框中,做如下操作,然后点击确定。
2、或者也可以选择【分析】-【非参数检验】-【独立样本】,跳出如下对话框:
在字段页将生活行为能力选为检验字段,将治疗组选为组;在设置页选中所有4种两个样本的非参数检验方法。最后点击运行。
结果分析
两种操作方式的计算结果是一致的,由于第二种操作的显示结果是综合显示,所以选取第二种操作的显示结果进行讲解。
从结果可知;K-S检验和Wald-Wolfowitz游程检验的结果是接受原假设,即两种治疗方法的效果没有显著性差异;Moses检验和Mann-Whitney U检验的结果是拒绝原假设,即两种治疗方法的效果有显著性差异;所以,不同的检验方法可能会有不同的结论,这也说明了非参数检验是一种近似的检验方法,提示我们一定要根据数据的性质和检验方法的侧重点合理的选择检验方法。
可以对比不同的检验方法原理,Mann-Whitney U检验常用判别两独立样本所属的总体是否具有相同分布,Moses检验和K-S检验主要用于检验两个样本是否来自相同总体,所以本题中,建议选择Mann-Whitney U检验的分析结果,即两种治疗方法的治疗效果有显著性差异。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
R 语言:数据科学与科研领域的核心工具及优势解析 一、引言 在数据驱动决策的时代,无论是科研人员验证实验假设(如前文中的 T ...
2025-09-08T 检验在假设检验中的应用与实践 一、引言 在科研数据分析、医学实验验证、经济指标对比等领域,常常需要判断 “样本间的差异是 ...
2025-09-08在商业竞争日益激烈的当下,“用数据说话” 已从企业的 “加分项” 变为 “生存必需”。然而,零散的数据分析无法持续为业务赋能 ...
2025-09-08随机森林算法的核心特点:原理、优势与应用解析 在机器学习领域,随机森林(Random Forest)作为集成学习(Ensemble Learning) ...
2025-09-05Excel 区域名定义:从基础到进阶的高效应用指南 在 Excel 数据处理中,频繁引用单元格区域(如A2:A100、B3:D20)不仅容易出错, ...
2025-09-05CDA 数据分析师:以六大分析方法构建数据驱动业务的核心能力 在数据驱动决策成为企业共识的当下,CDA(Certified Data Analyst) ...
2025-09-05SQL 日期截取:从基础方法到业务实战的全维度解析 在数据处理与业务分析中,日期数据是连接 “业务行为” 与 “时间维度” 的核 ...
2025-09-04在卷积神经网络(CNN)的发展历程中,解决 “梯度消失”“特征复用不足”“模型参数冗余” 一直是核心命题。2017 年提出的密集连 ...
2025-09-04CDA 数据分析师:驾驭数据范式,释放数据价值 在数字化转型浪潮席卷全球的当下,数据已成为企业核心生产要素。而 CDA(Certified ...
2025-09-04K-Means 聚类:无监督学习中数据分群的核心算法 在数据分析领域,当我们面对海量无标签数据(如用户行为记录、商品属性数据、图 ...
2025-09-03特征值、特征向量与主成分:数据降维背后的线性代数逻辑 在机器学习、数据分析与信号处理领域,“降维” 是破解高维数据复杂性的 ...
2025-09-03CDA 数据分析师与数据分析:解锁数据价值的关键 在数字经济高速发展的今天,数据已成为企业核心资产与社会发展的重要驱动力。无 ...
2025-09-03解析 loss.backward ():深度学习中梯度汇总与同步的自动触发核心 在深度学习模型训练流程中,loss.backward()是连接 “前向计算 ...
2025-09-02要解答 “画 K-S 图时横轴是等距还是等频” 的问题,需先明确 K-S 图的核心用途(检验样本分布与理论分布的一致性),再结合横轴 ...
2025-09-02CDA 数据分析师:助力企业破解数据需求与数据分析需求难题 在数字化浪潮席卷全球的当下,数据已成为企业核心战略资产。无论是市 ...
2025-09-02Power BI 度量值实战:基于每月收入与税金占比计算累计税金分摊金额 在企业财务分析中,税金分摊是成本核算与利润统计的核心环节 ...
2025-09-01巧用 ALTER TABLE rent ADD INDEX:租房系统数据库性能优化实践 在租房管理系统中,rent表是核心业务表之一,通常存储租赁订单信 ...
2025-09-01CDA 数据分析师:企业数字化转型的核心引擎 —— 从能力落地到价值跃迁 当数字化转型从 “选择题” 变为企业生存的 “必答题”, ...
2025-09-01数据清洗工具全景指南:从入门到进阶的实操路径 在数据驱动决策的链条中,“数据清洗” 是决定后续分析与建模有效性的 “第一道 ...
2025-08-29机器学习中的参数优化:以预测结果为核心的闭环调优路径 在机器学习模型落地中,“参数” 是连接 “数据” 与 “预测结果” 的关 ...
2025-08-29