京公网安备 11010802034615号
经营许可证编号:京B2-20210330
SPSS分析技术:两个独立样本的非参数检验
在医学类研究中,经常会遇到治疗效果无法量化,但需要比较不同治疗方法优劣的需求。例如,比较止痛药的效果,疼痛程度无法准确量化,只能用主观打分来描述;理疗复健方法的优劣也无法量化,只能通过病人的情况粗略划分成卧床,部分自主等层次。当遇到这样无法量化数据的比较要求时,应该如何进行比较呢?两个样本的非参数检验是合适的分析方法。下面将介绍两个独立样本的非参数检验方法。
两个独立样本的非参数检验
单个样本的非参数检验对比的是样本分布与已知分布,从而得出随机样本所代表的总体是否服从已知分布。两独立样本的非参数检验是对两个独立样本的分布情况直接进行对比,目的是获得关于两总体分布状况差异大小的信息。这与单个样本假设检验和两个样本假设检验是一个套路。
SPSS提供了4种检验方法:Mann-Whitney U检验(曼-惠特尼U检验)、K-S检验、Wald-Wolfowitz检验(随机序列检验)和Moses极端反应检验。它们的原假设都是两个样本来自的总体分布没有显著性差异,只不过它们的分析方法不同。
Mann-Whitney U检验
Mann-Whitney U检验又称Mann-Whitney秩和检验,可用于对两总体分布的比例判断。其原假设为:两个独立样本来自的两个总体的分布无显著差异。Mann-Whitney U检验通过对两组样本平均秩的研究来实现判断。
Mann-Whitney U检验原理:将两个样本混合后按升序排列,得到每个样本值的秩(排名),然后分别求得两组样本的平均秩,并对这两个平均秩进行比较。如果两个总体分布无显著差异,其秩应该差别不大,从而两组样本的平均秩差别较小;反之,若两总体差异显著,则二者的平均秩会有较大差异。此外,Mann-Whitney U检验还要计算样本A的秩大于样本B的秩的个数U1,以及样本B的秩优于A的秩的个数U2,如果总体分布无显著差异,则两者应该接近;反之,若两总体差异显著,则二者的平均秩会有较大差异。
两独立样本K-S检验
检验原理:首先将两独立样本的数据混合并按升序排列,然后分布计算两个独立样本秩的累计频率,并求得两个累计频率的差值序列数据以获得D统计量。SPSS将自动计算D统计量的概率P值,如果P值大于显著性水平,则接受原假设;反之,则拒绝原假设,即两个样本来自的总体分布差异显著。
两个独立样本Wald-Wolfowitz检验
将两组样本混合并升序排列。同时,两组样本的每个观测值对应的样本组标志值序列也将随之重新排序,求出此游程。如果所得游程数较小,说明两总体的分布差异较大;反之,则不存在显著性差异。同时SPSS将据此自动计算相伴概率P值,如果P值大于显著性水平临界值,则接受原假设;反之则拒绝原假设,即两个样本来自的总体分布差异显著。
两独立样本Moses极端反应检验
原理为:将一组样本作为控制样本;另一组作为比较样本。一般按升序排列的第一个值定义控制组,第二个值定义比较组。以控制组作为参照,检验比较组相对于控制组是否出现极端反应。为此,将两组样本混合并升序排列,求得控制样本最高秩次和最低秩次之间包含的观测值个数,即跨度,以及去掉两个极端值后的截头跨度。如果跨度和截头跨度都很小,说明比较样本可能存在极端反应,两总体的分布差异显著;如果比较样本没有出现极端反应,则两总体分布无显著差异。
范例分析
现在由一份运用药物治疗和物理治疗方法对中风患者治疗结果的数据,治疗结果被分成5各层次:正常、可以自主活动、部分肢体可以自主活动、卧床和无自理能力;总共记录了100位患者的治疗效果,需要分析两种治疗方法的结果是否有显著性差异。

分析步骤
1、选择菜单【分析】-【非参数检验】-【旧对话框】-【2个独立样本】,在跳出的对话框中,做如下操作,然后点击确定。
2、或者也可以选择【分析】-【非参数检验】-【独立样本】,跳出如下对话框:
在字段页将生活行为能力选为检验字段,将治疗组选为组;在设置页选中所有4种两个样本的非参数检验方法。最后点击运行。
结果分析
两种操作方式的计算结果是一致的,由于第二种操作的显示结果是综合显示,所以选取第二种操作的显示结果进行讲解。
从结果可知;K-S检验和Wald-Wolfowitz游程检验的结果是接受原假设,即两种治疗方法的效果没有显著性差异;Moses检验和Mann-Whitney U检验的结果是拒绝原假设,即两种治疗方法的效果有显著性差异;所以,不同的检验方法可能会有不同的结论,这也说明了非参数检验是一种近似的检验方法,提示我们一定要根据数据的性质和检验方法的侧重点合理的选择检验方法。
可以对比不同的检验方法原理,Mann-Whitney U检验常用判别两独立样本所属的总体是否具有相同分布,Moses检验和K-S检验主要用于检验两个样本是否来自相同总体,所以本题中,建议选择Mann-Whitney U检验的分析结果,即两种治疗方法的治疗效果有显著性差异。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
逻辑回归是数据分析、机器学习、统计建模中应用最广泛的二分类预测模型,常用于风险判断、行为预测、归因分析等场景。在SPSS、Py ...
2026-06-02数字经济时代,市场竞争日趋同质化,用户消费需求愈发个性化、多元化,传统依托经验、粗放式、广撒网的营销模式弊端日益凸显。长 ...
2026-06-02 很多数据分析师做过按月份的销售额趋势图,画过按天的流量折线图,但当被问到“时间序列和普通数据有什么本质区别”“季节性 ...
2026-06-02在市场竞争日趋饱和、用户需求不断细分的当下,企业创业创新、产品迭代与市场拓展不再依赖经验决策,而是需要系统化、工具化的商 ...
2026-06-01【核心关键词】调度、岗位、数据库、企业、报表、培训、程序、数据分析、数据加工、业务部门、企业数据、调度工具、业务指标、 ...
2026-06-01 很多数据分析师能熟练地计算指标、搭建标签体系,但当被问到“画像到底在解决什么问题”“画像和标签是什么关系”“画像如何 ...
2026-06-01在数据统计分析、数据清洗、异常值识别与数据分布研究中,箱型图是最直观、高效、专业的可视化分析工具。相较于柱状图、折线图仅 ...
2026-05-29Tkinter是Python内置的标准GUI图形界面库,具备无需额外安装、调用简单、兼容性强、轻量化高效等优势,是Python快速开发桌面小程 ...
2026-05-29 很多分析师在设计标签时思路清晰,但真到落地环节却面临“数据在手,不知如何转化为可用标签”的困境:或因加工方式选择不当 ...
2026-05-29【核心关键词】大数据、经理、专业、金融、客户、传统、建模、数据产品、互联网金融、产品经理、数据分析、金融行业、数据模型 ...
2026-05-28 很多分析师每天和数据打交道,但当被问到“标签是什么”“标签和指标有什么区别”“标签体系如何设计”时,却常常答不上来。 ...
2026-05-28随着大数据技术的快速普及,各行各业积累了海量的用户数据、交易数据、生产数据与行为数据。单纯的数据统计与报表分析只能呈现表 ...
2026-05-28在Python网络请求、接口测试、数据爬取、业务对接开发中,Requests库是最简洁、最高效的HTTP请求工具,凭借简洁的语法、完善的适 ...
2026-05-272025 年,零售与服务行业的竞争已从 “经验驱动” 全面转向 “数据驱动”。中小企业门店普遍面临数据零散、分析浅层、决策凭感觉 ...
2026-05-27 很多数据分析师每天都在写SQL,但当被问到“数据查询语言(DQL)的本质是什么”“SELECT语句中各子句的书写顺序与实际执行顺 ...
2026-05-27在统计学分析、实验研究、业务数据复盘过程中,单因素方差分析是检验自变量对因变量是否存在显著影响的核心方法。其中,两个水平 ...
2026-05-26【核心关键词】算法、客户、大数据、互联网、调优、建模、模型优化、机器学习、评分卡模型、模型开发、智能风控、业务场景、数 ...
2026-05-26 很多数据分析师写过无数个 SELECT,但当被问到“新建一张表,该如何定义字段类型来保证数据质量”“创建视图和存储物理表有 ...
2026-05-26在数据清洗、统计分析与数据质量检测工作中,箱型图(又称箱线图、Box Plot)是最直观、最高效的可视化分析工具之一。相较于柱状 ...
2026-05-25在大数据分析、数据清洗、质量管控、风险监测等领域,异常数据识别是保障数据质量、确保分析结论精准、规避业务决策失误的核心基 ...
2026-05-25