
手把手教你协方差分析的SPSS操作
一、问题与数据
某研究将73例脑卒中患者随机分为现代理疗组(38例)和传统康复疗法组(35例)进行康复治疗,采用Fugl-Meyer运动功能评分法(FMA)分别记录治疗前、后的运动功能情况,部分数据如下。试问现代理疗和传统康复治疗对脑卒中患者运动功能的改善是否有差异?
二、对数据结构的分析
整个数据资料涉及2组患者(共73例),每名患者有康复治疗前、后2个数据,测量指标为FMA评分。由于治疗前的FMA分数会对治疗后的FMA分数产生影响,因此在比较现代理疗和传统康复疗法对患者运动功能的改善情况时,应把治疗前的FMA评分作为协变量进行调整,若满足协方差分析的应用条件,可采用完全随机设计的协方差分析。
协方差分析可以控制混杂因素对处理效应的影响,提高假设检验的效能和分析结果的精度。其应用条件包括:受试对象的观测指标满足独立性,各处理组的观测指标均来自正态分布总体,且方差相等。需要控制的协变量(自变量)与观测指标(因变量)之间存在线性关系,且每个组用协变量(自变量)与观测指标(因变量)进行直线回归时,回归直线的斜率相同(即各组回归直线平行)。
1. 各组回归直线是否平行的假设检验;
2. 各组观测指标方差是否相同的假设检验;
3. 协变量(自变量)与观测指标(因变量)之间是否存在线性关系的假设检验;
4. 控制协变量的影响后,各组调整的均数是否相等的假设检验。
三、SPSS分析方法
1、数据录入SPSS
(组别1=现代理疗组,组别2=传统康复疗法组,FMA1=治疗前FMA评分,FMA2=治疗后FMA评分)
2、选择Analyze→General Linear Model→Univariate
3、选项设置
A. 主对话框设置:选择观测指标(FMA2)到Dependent Variable窗口,组别变量到Fixed Factor(s)窗口,协变量(FMA1)到Covariate(s)窗口。
B. Model设置:点击Model按钮→选择Custom选项→将组别和FMA1分别放入Model窗口→将组别和FMA1同时选中(按住Ctrl后分别点击“组别”和“FMA1”),选入Model窗口构成交互项→点击Continue返回主对话框→OK。
放入分组变量与协变量的交互项是为了检验各组回归直线是否平行,若交互项结果满足P>0.05,则尚不能认为各组协变量与观测指标之间的回归直线斜率不等。在各组回归直线平行的条件成立时,才可以考虑进一步使用协方差分析。当处理因素与协变量有交互作用,即各组回归直线平行的条件不成立时(P<0.05),应对资料进一步处理或采用其他方法。
得到结果后,这一步仅需要查看Tests of Between-Subjects Effects的结果,组别*FMA1一行为各组回归直线是否平行进行假设检验的结果。F=0.703,P(Sig.)=0.405 >0.05,尚不能认为两组治疗前FMA评分与治疗后FMA评分之间回归直线的斜率不等,即满足回归直线平行的条件(这一步是协方差分析的假设检验1)。因此,可以做协方差分析,接下来需要重复上述步骤2、步骤3,并在Model设置中,将分组变量与协变量的交互项从模型中去掉,如下图所示。
C. Options设置:点击Options按钮→在Display部分勾选Descriptive statistics(给出各组及总的例数、均数和标准差)、Homogeneity tests(给出方差齐性检验结果)、Parameter estimates(给出协方差模型的各个参数)→将组别变量放入Display means for窗口(给出各组调整均数的估计值)→点击Continue返回主对话框→OK。
四、结果解读
Descriptive Statistics表格给出了治疗后FMA评分的部分统计信息,包括两组及总的例数(N)、均数(Mean)和标准差(Std. Deviation)。
Levene’s Test of Equality of Error Variances表格给出了方差齐性检验的结果,F=0.199,P(Sig.)=0.657,尚不能认为两组治疗后FMA评分的方差不等,即满足方差齐的条件(这一步是协方差分析的假设检验2)。
Tests of Between-Subjects Effects表格给出了协方差分析结果(不含交互项),其中FMA1一行为协变量与观测指标之间是否存在线性关系的假设检验结果。F=134.213,P(Sig.)<0.001,可以认为治疗前FMA评分与治疗后FMA评分之间存在线性关系,即满足线性关系的条件(这一步是协方差分析的假设检验3)。
组别一行为各组观测指标调整的均数是否相等的假设检验结果。F=7.866,P(Sig.)=0.007 <0.05,两组之间治疗后FMA评分的差异具有统计学意义,说明现代理疗和传统康复治疗对脑卒中患者运动功能的改善是有差异的。(这一步是协方差分析的假设检验4。协方差分析需要满足前3个假设后,才能根据假设检验4推断研究问题。如果前3个假设不满足,则不能进行协方差分析)
Parameter Estimates表格给出了协方差模型参数估计的结果。本例中的协方差模型为:
Estimated Marginal Means表格给出了协方差分析时观测指标的调整均数,各组调整的均数是利用参数估计的结果计算的。用各组FMA1的总平均数代入上面的协方差模型,即可得到观测指标的调整均数。
五、撰写结论
根据基线运动功能调整后,现代理疗方法对脑卒中患者进行康复治疗的运动功能得分为55(95% CI:52-57),传统康复疗法的运动功能得分为50(95% CI:48-53)。两种方法对脑卒中患者运动功能改善的差异具有统计学意义,现代理疗方法优于传统康复疗法(F=7.866,P=0.007)。
六、延伸阅读
本例如果用康复治疗前、后的FMA评分相减,生成一个差值,再对两组间的差值进行两样本均数比较的t检验,其结果如何呢?
t=2.527,P=0.014,两组间FMA评分变化的差异具有统计学意义。虽然t检验得出的结论与协方差分析的结论相同,但是把前、后测量值转换为差值之后,原有的数据信息也会有所损失。而且,如果两组间基线值有差异,差值更不能作为判别组间差别的依据。因此,将基线值作为协变量进行校正的协方差分析是科学可行的常用方法。数据分析师培训
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23在数据分析全流程中,“数据清洗” 恰似烹饪前的食材处理:若食材(数据)腐烂变质、混杂异物(脏数据),即便拥有精湛的烹饪技 ...
2025-10-23在人工智能领域,“大模型” 已成为近年来的热点标签:从参数超 1750 亿的 GPT-3,到万亿级参数的 PaLM,再到多模态大模型 GPT-4 ...
2025-10-22在 MySQL 数据库的日常运维与开发中,“更新数据是否会影响读数据” 是一个高频疑问。这个问题的答案并非简单的 “是” 或 “否 ...
2025-10-22在企业数据分析中,“数据孤岛” 是制约分析深度的核心瓶颈 —— 用户数据散落在注册系统、APP 日志、客服记录中,订单数据分散 ...
2025-10-22在神经网络设计中,“隐藏层个数” 是决定模型能力的关键参数 —— 太少会导致 “欠拟合”(模型无法捕捉复杂数据规律,如用单隐 ...
2025-10-21在特征工程流程中,“单变量筛选” 是承上启下的关键步骤 —— 它通过分析单个特征与目标变量的关联强度,剔除无意义、冗余的特 ...
2025-10-21在数据分析全流程中,“数据读取” 常被误解为 “简单的文件打开”—— 双击 Excel、执行基础 SQL 查询即可完成。但对 CDA(Cert ...
2025-10-21在实际业务数据分析中,我们遇到的大多数数据并非理想的正态分布 —— 电商平台的用户消费金额(少数用户单次消费上万元,多数集 ...
2025-10-20在数字化交互中,用户的每一次操作 —— 从电商平台的 “浏览商品→加入购物车→查看评价→放弃下单”,到内容 APP 的 “点击短 ...
2025-10-20在数据分析的全流程中,“数据采集” 是最基础也最关键的环节 —— 如同烹饪前需备好新鲜食材,若采集的数据不完整、不准确或不 ...
2025-10-20在数据成为新时代“石油”的今天,几乎每个职场人都在焦虑: “为什么别人能用数据驱动决策、升职加薪,而我面对Excel表格却无从 ...
2025-10-18数据清洗是 “数据价值挖掘的前置关卡”—— 其核心目标是 “去除噪声、修正错误、规范格式”,但前提是不破坏数据的真实业务含 ...
2025-10-17在数据汇总分析中,透视表凭借灵活的字段重组能力成为核心工具,但原始透视表仅能呈现数值结果,缺乏对数据背景、异常原因或业务 ...
2025-10-17在企业管理中,“凭经验定策略” 的传统模式正逐渐失效 —— 金融机构靠 “研究员主观判断” 选股可能错失收益,电商靠 “运营拍 ...
2025-10-17在数据库日常操作中,INSERT INTO SELECT是实现 “批量数据迁移” 的核心 SQL 语句 —— 它能直接将一个表(或查询结果集)的数 ...
2025-10-16在机器学习建模中,“参数” 是决定模型效果的关键变量 —— 无论是线性回归的系数、随机森林的树深度,还是神经网络的权重,这 ...
2025-10-16在数字化浪潮中,“数据” 已从 “辅助决策的工具” 升级为 “驱动业务的核心资产”—— 电商平台靠用户行为数据优化推荐算法, ...
2025-10-16在大模型从实验室走向生产环境的过程中,“稳定性” 是决定其能否实用的关键 —— 一个在单轮测试中表现优异的模型,若在高并发 ...
2025-10-15