【连载3】如何使用spss做非参数检验-CDA数据分析师官网

热线电话：13121318867

【连载3】如何使用spss做非参数检验

2014-11-28

【连载3】如何使用spss做非参数检验

非参数检验是一个相当宏大的命题。由于实际情况的复杂多变，因此非参数检验包括了许多的各种各样的检验方法。之前我们提过，参数检验的使用条件是被检验的样本总体服从正态分布，而非参数检验的使用条件自然就是总体不服从或不确定是否服从正态分布。（实际上，这里要特别说明一下，尽管非参数检验的使用条件更宽松，但是考虑到精确性，不是特殊要求的话，我们还是尽可能的使用均值检验。）

比较常见的单样本非参数检验包括游程检验和单样本K-S检验。

游程检验：

它通常用于检测两个不同的观测值出现的次序是否具有随机性。举个例子，假如我们想知道每天来门诊就诊的人是否生病的次序是否随机，那么我们就使用游程检验。我们记录下来个案依次是否生病，比如是为1，否为0。然后我们就有了一个由0和1构成的变量列，

我们选择分析——非参数检验——旧对话框——游程，在主面板的检验变量列表里选入我们的0,1变量列。选项卡里边选择描述性，其他默认。割点可以全选。

输出结果看p值就可以了（我真的不想再重复怎么看p值了）。

单样本K-S检验;

这个就比较重要了。这个检验的目的在于观测样本的分布。哦，想想也知道很重要。只要我们想做相关和回归，那我们就最好用K-S检验来检查一下样本的分布。毕竟pearson相关系数有效的一个重要条件就是样本服从正态分布。

我们选择分析——非参数检验——旧对话框——1样本K-S，在主对话框的检验变量列表里边选入我们想检验分布的变量（比如一群病号的血细胞数），选项卡里勾选描述性和四分位数，其他默认。在检验分布的下边有四个供勾选的框框，这个要注意一下，常规指的就是正态分布，相等则是指均匀分布，勾选你想检验的分布（一般是正态分布）。确定以后就可以看结果了。

描述性统计量表会给你一些基本指标，帮助你感受这些数据。K-S检验表的p值会告诉你样本是否服从指定的分布，如果是的话，表里边还有一些其他的指标可以参考。

单样本非参数检验已经结束了（怎么这么少？），下边我们说一下独立样本非参数检验。

两独立样本非参数检验：

打开菜单分析——非参数检验——旧对话框——2个独立样本，在主面板里边检验变量选入检验变量，分组变量选入分组变量，选项卡中选入描述性，四分位数，其他默认。在检验类型里边有四个供勾选的框框，我们一一学习。

Mann-whitney 检验：

就是大名鼎鼎的秩和检验。

这个检验利用样本观察值得秩来推断两样本所在总体的分布是否相同（不晓得什么是秩的回去翻一遍你们的高数课本）。这是一个最常用的检验。举例，假设我们知道一组患病的人和不患病的人的血细胞数，想检查是否具有差异，那么我们就使用秩和检验，我保证没举错例子，这个例子确实也可以用独立样本t检验来做（希望大家还记得什么叫独立样本t检验），当然也可以用秩和检验来做。

它会给出描述性统计量，秩表，检验统计量表。在最后的一个表里边我们通过p值判断差异是否显著。

Moses极端反应检验：

它适用于实验条件导致两个不同方向的极端反应情况（多用于医学，比如有的药物会导致一部分病人好转的同时也会导致一部分病人恶化）。

它通过比较实验组和观察组，会告诉你是否产生了极端反应。（很神奇是不是？）

两样本K-S检验：

这个检验用来判断两个样本的分布是否相同。也是看p值哈。

Wald wolfowit游程检验：

用来检验两样本是否来自相同的总体。

注意：K-S检验适用于数值变量资料或者有序分类资料。

多个独立样本非参数检验：

打开菜单分析——非参数检验——旧对话框——K 独立检验，在主面板的检验变量选入想检验的变量，分组变量选入分组变量。

检验类型有三种

K-W检验：

用来判断各样本分别代表的总体是否一致，（相当于单因素方差分析），适用于数值变量和有序分类变量。结果会给出秩，检验统计量。通过p值判断差异性。若想在进行两两比较，那就要用到上边介绍的秩和检验来进行比较了。

中位数：

适用于数值变量资料。用来检验样本代表的总体中位数是不是相等。这个用途还是比较广泛的。

Jonckheere-Terpstra检验：

这个检验用来处理完全随机的资料，比如研究随着年龄增加，学习成绩是否也增加？这种有序分组的变量就用这个检验来检验。（我真有点懒得介绍这么冷门的检验的冲动，不过为了完整还是写一下吧。）

两相关样本非参数检验：

打开两个关联样本检验主面板，检验对里边选择两个相关变量，检验类型有四种。

Wilcoxon：

它用来检验两个变量的分布是否有差异。比较常用。比如一种药物治疗前和治疗后是否有差别？就用这个检验。

符号检验和wilcoxon差不多，也是检查差值的。

Mcnemar检验：

上边两个都是数值型的连续性资料，这个检验则用于配对计数资料，将两组人进行配对，观察他们的某个指标是否有差异。

边际同质性检验是mcnemar检验的一般化和扩展，用于多分类配对计数资料。比如检验甲观察的分类结果和乙观察的分类结果是否有差异。（分好多类）

多个相关样本非参数检验：

打开多个相关样本检验主面板，选入检验变量，检验类型一共有三种。

Friedman检验：

用于检验多个相关样本是否来自同一总体，是wilcoxon的扩展。

KendallW检验：

检验样本的一致性的好坏（不考虑分布的形状，仅考虑分布是否一致）。

Cochran Q检验：

用于二分数据时，是mcnemar检验的延伸，可以比较多个二分变量的比例的差异是否显著。

非参数检验大概就是这些内容了。和参数检验一样，这些检验的操作操作并不复杂，结果也不难判断，学习的难点在于记住这些不同的检验方法的适用的不同范围。需要多做一些练习，才可以巩固掌握住非参数检验的内容。CDA 数据分析师培训

CDA数据分析师考试相关入口一览（建议收藏）：

▷ 想报名CDA认证考试，点击>>> “CDA报名” 了解CDA考试详情；

▷ 想学习CDA考试教材，点击>>> “CDA教材” 了解CDA考试教材；

▷ 想加入CDA考试题库，点击>>> “CDA题库” 了解CDA考试题库；

▷ 想了解CDA考试含金量，点击>>> “CDA含金量” 了解CDA考试详情；

▷ 想了解CDA院校合作，点击>>> “院校合作” 了解咨询CDA院校合作；

正态分布方差分析数据分析

数据分析咨询请扫描二维码

若不方便扫码，搜微信号：CDAshujufenxi

上一篇随机森林 vs XGBoost vs 决策树：算法选择中的

下一篇图论在大数据分析中的作用！

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

京公网安备 11010802034615号经营许可证编号：京B2-20210330

联系电话：13321103290 (微信同号)

客服在线

立即咨询

客服在线

立即咨询

免密码登录

提交首次登录验证后自动注册

【连载3】如何使用spss做非参数检验

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

【CDA干货】数据分析核心技能体系：从工具落地到业 ...

【CDA干货】企业价值市场法价值比率与线性回归分析 ...

从“零散明细”到“多维洞察”：CDA数据分析师视角 ...

CDA持证人专访：赵君研谈金融行业数据分析与运营岗 ...

【CDA干货】多维度对比评估：分析逻辑与可视化效果 ...

从“静态数据”到“动态资产”：CDA数据分析师视角 ...

CDA持证人专访：贺译册谈产品经理的市场洞察力与数 ...

【CDA干货】多维度对比评估：分析逻辑与可视化效果 ...

从“单元格”到“字段”：CDA数据分析师视角下的表 ...

【CDA干货】漏斗拆解：核心逻辑、实操方法与业务优 ...

【CDA干货】SQL数值转日期函数全解析：主流数据库语 ...

数据分析必修课：CDA数据分析师视角下的表格结构数 ...

CDA持证人专访：杨旭谈数据产品经理的工作实践与核 ...

【CDA干货】Python变量定义与类实例化：核心原理、 ...

从“单元格”到“洞察”：CDA数据分析师视角下的表 ...

【CDA干货】联合索引与覆盖索引：本质区别、实战场 ...

【CDA干货】维度表与事实表：数据仓库建模的核心逻 ...

从“指标堆砌”到“体系落地”：CDA数据分析师视角 ...

【CDA干货】SQL计算列值趋势的全场景实现方法与实战 ...

【CDA干货】用户决策链路全解析：从认知到复购的增 ...

CDA教育闭环

常见问题

关于我们

CDA数据分析师公众号

CDA考试中心小程序

CDA数据分析师App下载