
SPSS:T检验、方差分析、非参检验、卡方检验的使用要求和适用场景
一、T检验
1.1 样本均值比较T检验的使用前提
正态性;(单样本、独立样本、配对样本T检验都需要)
连续变量;(单样本、独立样本、配对样本T检验都需要)
独立性;(独立样本T检验要求)
方差齐性;(独立样本T检验要求)
1.2 样本均值比较T检验的适用场景
单样本T检验(比较样本均数和总体均数);
操作:打开 分析—比较均值—单样本t检验
要求:正态性(可以用K-S检验法,在SPSS中的“分析”–“非参数检验”—“单样本”中;或者直接根据直方图、P-P图,Q-Q图来观察或根据偏度峰度法来分析)
说明:由中心极限定理可知,即使原数据不符合正态分布,只要样本量足够大时样本均数分布仍然是正态的。只要数据不是强烈的偏正态,没有明显的极端值,一般而言单样本t检验都是可以使用的,分析结果都是稳定的。
独立样本T检验(比较成组设计的两个样本);
操作:打开 分析—比较均值—独立样本t检验
我们输入数据的时候,两个样本的数据是要在一列变量里的,另外还有一列二分类变量为这列因变量做标注。
要求:独立性、正态性(对正态性有耐受性)、方差齐性(影响大,检验更有必要,使用Levene’s检验,两样本T检验中提供Levene’s检验,如需更详细的检验结果可在“分析”–“描述统计”–“探索”中进行)
说明:各样本相互独立,且均来自于正态分布的样本,各样本所在总体的方差相等;
* 疑问:独立性怎么检验?有些数据可以根据现实环境判断;*
配对样本T检验(如用药前和用药后的两个人群的样本、同一样品用两种方法的比较)
操作:打开 分析—比较均值—配对样本t检验
要求:正态性(配对样本等价于单样本T检验,检验的是两个样本对应的差值,初始假设为差值等于0)
二、单因素方差分析
2.1 单因素方差分析的基本思想
基本思想:变异分解,总变异=随机变异+处理因素导致的变异,又可以分解为总变异=组内变异+组间变异,F=组间变异/组内变异,F的值越大,处理因素的影响越大。
2.2 单因素方差分析的使用前提
独立性:不满足独立性会有很大的影响,因为信息存在“重叠”的部分
疑问:在哪儿可以验证?卡方检验?卡方检验检验的是两个分类变量
正态性:对正态性的要求是稳健的
方差齐性:检验方法除了Levene’s检验,还可以有其他的检验方法:Bartleet法(比较各组方差的加权算数平均数和几何均数)、Hartley法(样本量相同时使用)、Cochran法(样本量相同时使用)。
方差分析对变量的类型有要求吗?应该分析的都是连续变量
2.3 单因素方法分析的使用前提不满足时变换方法
对数变换、平方根变换、平方根反正弦变换、平方变换、倒数变换、Box-Cox变换(分段函数)
2.4 单因素方差分析的适用场景
T检验只能检验两组样本的均数差,多组样本的时候就需采用方差分析;
操作:打开分析—比较均值—均值 进行预分析,可以大致看出各均值是否相同,方差是否齐性;再进行 打开 分析—比较均值—单因素anova;
适用场景:均数间的多重比较(全部两两比较)、各组均数的精细比较(可以指定要比较的两个组,通过设定系数)、组间均数的趋势检验(为了利用分组变量中体现出的次序信息,目的不是为了拟合线性或非线性的模型,而是希望知道因素的水平改变时均数的变化趋势)
2.5 方差分析结束后如均值不同可进行两两比较(事前比较、事后比较)
LSD法:用于事先计划好的比较,最灵敏;检验水准没有校正,每次都是α
Sidak法:第二灵敏;
Bonferroni法:用于事先计划好的比较,第三灵敏;
Scheffe法:多用样本含量不等的情况,第四灵敏;
Dunnett法:常用于多个实验组和一个对照组的比较,第五灵敏;
寻找同质亚组的检验方法:
S-N-K法:将所有样本分为多个子集;
Tukey法:任意两组比较,要求样本含量相同,MEER不超过α;
Duncan法:与SNK法类似;
备注:
CER:每进行一次比较犯一类错误错误的概率;
EERC:完全无效假设检验下,做完全部比较犯一类错误的概率;
MEER:部分或者任何完全假设下,犯一类错误的最大概率值,即最大实验误差率。
疑问:单因素方差分析的事前检验和事后检验有什么区别,为什么结果不同??
三、非参数检验
3.1 非参数检验的基本思想
非参数检验的意思是指整个推断过程和结论均和原总体参数无关,而不是不利用参数
3.2 非参数检验的优势
稳健性;
对数据的测量尺度、数据类型无约束;
适用于小样本、无分布样本、数据污染样本、混杂样本等;
3.3 非参数检验使用前提
有序、名义变量,这类数据的分布形态一般未知,均值方差等数据无意义;
样本分布未知;
样本数据不满足正态分布,即便是经过变量变换;
方差齐性不满足,即便是经过变量变换;
总体分布正态,连续变量,但样本容量极小,如10以下;
3.2 非参数检验适用情形
单样本非参数检验
K-S检验:针对连续变量,考察是否符合正态分布
操作:打开–分析–非参数检验–单样本
二项分布检验:针对两分类变量,考察是否符合二项分布
操作:打开–分析–非参数检验–单样本
游程检验:考察总体的随机性
操作:打开–分析–非参数检验–单样本
两个独立样本的非参数检验(无效假设为两样本的中心位置是否相等)
Mann-Whitney U检验,两样本秩和检验,应用范围最广;
Kolmogorov-Smirnov Z检验:检验两个样本的累积频数分布曲线,判断两个样本的分布是否相同;
Moses Extreme Reactions 检验:Moses极端反应检验,单侧检验
Wald-Wolfowitz Runs 检验:单侧检验,无论是集中趋势、离散趋势、偏度的波动情况都能检测出来,如果只是检查中心位置,最好不用,检验两样本是否来自同样的分布;
操作:打开 分析—非参数检验—独立样本
多个独立样本的非参数检验
Kruskal-Wallis H检验(类似Wilcoxon符号秩检验,两样本在多样本上的推广)
中位数检验
Jonckheere-Terpstra检验:对连续变量和有序分类资料都使用,分组变量为有序分类资料时,检验效能要高于Kruskal-Wallis H检验
操作:打开 分析—非参数检验—独立样本
两个配对样本(求出差值,查看中位数是否为0,目的就是为了检验均值是否相等)
sign符号检验:只利用了符号信息,差值是否一半为正一半为负;
Wilcoxon符号秩检验:利用了符号和差值的大小顺序(符号+秩序)
操作:打开 分析—非参数检验—相关样本
多个相关样本非参数检验
Friedman 检验:基本思想是同区组的处理值和计算的秩比较才有意义,还附带齐性子集结果给出了准确的两两比较信息;
Kendall协和系数检验:为了检验各组评价是否一致,Friedman检验只能说明尚不能认为有差异,但是无法评判一致性,Kendall方法针对连续变量,
Cochran检验:有些评价只能用是否、好坏等二元数据来判断,Cochran只适用于二分类变量,用Kendall方法会有很多的打结现象。
操作:打开 分析–非参数检验–相关样本
通用方法—秩变换分析方法
前面有关秩的分析方法其实都是秩变换方法的不同应用,分析方法中可以直接将秩求出后再进行分析。
操作:转换 — 个案排秩(也可以指定生成符合正态分布的秩)
四、卡方检验
4.1 卡方检验的基本思想
以卡方分布为基础,计算观察值和期望值之间的偏离程度;
4.2 卡方检验的使用前提
最小期望频数均大于1
至少4/5的单元格期望频数大于5
计算时如果单元格期望频数小于5要和其他种类合并
样本观察值量超过50
4.3 卡方检验的使用目的
考察无序分类变量各水平在两组或多组间的分布是否一致;
检验某个连续变量的分布是否和理论分布一致;
分类变量的概率是否等于指定概率;
检验两个分类变量是否独立;
检验控制了其中几个因素后,剩余的两个分类变量是否独立;
检验两种方法的结果是否一致;
4.4 卡方检验的适用场景
单样本卡方检验
操作: 打开 分析–非参数检验–单样本
两样本卡方检验
操作: 打开 分析–描述统计–交叉表
两分类变量间关联程度的度量:定性描述两个分类变量是否存在关联(更为详细的可以根据相关分析)
操作: 打开 分析–描述统计–交叉表
Kappa一致性检验(用于配对样本,如两个人针对一个事物的评价)
用于配对样本的检验,Kappa检验的结果是两个人的评价是否是相关的
操作: 打开 分析–描述统计–交叉表
Mcnemar 配对卡方检验
Kappa检验只能看出两者是否有关联,但是不能判断是否一致,Mcnemar 配对卡方检验就可以解决两者是否一致的问题
操作: 打开 分析–描述统计–交叉表
分层卡方检验
可以控制一个因素,如收入对车辆购买率的影响,可以将城市作为分层因素,从而可以得到更准确的结果,但是SPSS中只能进行两分类变量的检验,不能进行多分类的检验,且分层因素和要分析的因素之间如果存在交互关系也不能进行检验。
操作: 打开 分析–描述统计–交叉表
4.5 备注
相对危险度(RR)
RR=试验人群反应阳性的概率/对照组人群反应阳性的概率
RR=1,说明试验因素反应阳性没有关联
RR<1,说明试验因素导致反应阳性的发生率降低
RR>1,说明试验因素导致反应阳性的发生率升高
优势比(OR)
OR=(反应阳性组中实验因素阳性人数/反应阳性组中实验因素阴性人数)/(反应阴性组中实验因素阳性人数/反应阴性组中实验因素阴性人数)
OR>1,说明该试验因素更容易导致实验结果为阳性
推荐学习书籍
《CDA一级教材》适合CDA一级考生备考,也适合业务及数据分析岗位的从业者提升自我。完整电子版已上线CDA网校,累计已有10万+在读~
免费加入阅读:https://edu.cda.cn/goods/show/3151?targetId=5147&preview=0
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
CDA 干货分享:统计学的应用 在数据驱动业务发展的时代浪潮中,统计学作为数据分析的核心基石,发挥着无可替代的关键作用。 ...
2025-06-18CDA 精益业务数据分析:解锁企业增长新密码 在数字化浪潮席卷全球的当下,数据已然成为企业最具价值的资产之一。如何精准地 ...
2025-06-18CDA 培训:开启数据分析师职业大门的钥匙 在大数据时代,数据分析师已成为各行业竞相争夺的关键人才。CDA(Certified Data ...
2025-06-18CDA 人才招聘市场分析:机遇与挑战并存 在数字化浪潮席卷各行业的当下,数据分析能力成为企业发展的核心竞争力之一,持有 C ...
2025-06-17CDA金融大数据案例分析:驱动行业变革的实践与启示 在金融行业加速数字化转型的当下,大数据技术已成为金融机构提升 ...
2025-06-17CDA干货:SPSS交叉列联表分析规范与应用指南 一、交叉列联表的基本概念 交叉列联表(Cross-tabulation)是一种用于展示两个或多 ...
2025-06-17TMT行业内审内控咨询顾问 1-2万 上班地址:朝阳门北大街8号富华大厦A座9层 岗位描述 1、为客户提供高质量的 ...
2025-06-16一文读懂 CDA 数据分析师证书考试全攻略 在数据行业蓬勃发展的今天,CDA 数据分析师证书成为众多从业者和求职者提升竞争力的重要 ...
2025-06-16数据分析师:数字时代的商业解码者 在数字经济蓬勃发展的今天,数据已成为企业乃至整个社会最宝贵的资产之一。无论是 ...
2025-06-16解锁数据分析师证书:开启数字化职业新篇 在数字化浪潮汹涌的当下,数据已成为驱动企业前行的关键要素。从市场趋势研判、用 ...
2025-06-16CDA 数据分析师证书含金量几何?一文为你讲清楚 在当今数字化时代,数据成为了企业决策和发展的重要依据。数据分析师这一职业 ...
2025-06-13CDA 数据分析师:数字化时代的关键人才 在当今数字化浪潮席卷全球的时代,数据已然成为驱动企业发展、推动行业变革的核心要素。 ...
2025-06-13CDA 数据分析师报考条件全解析 在大数据和人工智能时代,数据分析师成为了众多行业追捧的热门职业。CDA(Certified Data Analyst ...
2025-06-13“纲举目张,执本末从。”若想在数据分析领域有所收获,一套合适的学习教材至关重要。一套优质且契合需求的学习教材无疑是那关键 ...
2025-06-092025 年,数据如同数字时代的 DNA,编码着人类社会的未来图景,驱动着商业时代的运转。从全球互联网用户每天产生的2.5亿TB数据, ...
2025-05-27CDA数据分析师证书考试体系(更新于2025年05月22日)
2025-05-26解码数据基因:从数字敏感度到逻辑思维 每当看到超市货架上商品的排列变化,你是否会联想到背后的销售数据波动?三年前在零售行 ...
2025-05-23在本文中,我们将探讨 AI 为何能够加速数据分析、如何在每个步骤中实现数据分析自动化以及使用哪些工具。 数据分析中的AI是什么 ...
2025-05-20当数据遇见人生:我的第一个分析项目 记得三年前接手第一个数据分析项目时,我面对Excel里密密麻麻的销售数据手足无措。那些跳动 ...
2025-05-20在数字化运营的时代,企业每天都在产生海量数据:用户点击行为、商品销售记录、广告投放反馈…… 这些数据就像散落的拼图,而相 ...
2025-05-19