京公网安备 11010802034615号
经营许可证编号:京B2-20210330
SPSS 教程 | 生存分析的 Cox 回归模型
一生存分析基本概念
1、事件(Event)
指研究中规定的生存研究的终点,在研究开始之前就已经制定好。根据研究性质的不同,事件可以是患者的死亡、疾病的复发、仪器的故障,也可以是下岗工人的再就业等等。
2、生存时间(Survival time)
指从某一起点到事件发生所经过的时间。生存是一个广义的概念,不仅仅指医学中的存活,也可以是机器出故障前的正常运行时间,或者下岗工人再就业前的待业时间等等。有的时候甚至不是通用意义上的时间,比如汽车在出故障前的行驶里程,也可以作为生存时间来考虑。
3、删失(Sensoring)
指由于所关心的事件没有被观测到或者无法观测到,以至于生存时间无法记录的情况。常由两种情况导致:(1)失访;(2)在研究终止时,所关心的事件还未发生。
4、生存函数(Survival distribution function)
又叫累积生存率,表达式为 S(t)=P(T>t), 其中 T 为生存时间,该函数的意义是生存时间大于时间点 t 的概率。t=0 时 S(t)=1,随着 t 的增加 S(t) 递减(严格的说是不增),1-S(t)为累积分布函数,表示生存时间 T 不超过 t 的概率。
二生存分析的方法
1、生存分析的主要目的是估计生存函数,常用的方法有 Kaplan-Meier 法和寿命表法。对于分组数据,在不考虑其他混杂因素的情况下,可以用这两种方法对生存函数进行组间比较。
2、如果考虑其他影响生存时间分布的因素,可以使用 Cox 回归模型(也叫比例风险模型),利用数学模型拟合生存分布与影响因子之间的关系,评价影响因子对生存函数分布的影响程度。这里的前提是影响因素的作用不随时间改变,如果不满足这个条件,则应使用含有时间依存协变量的 Cox 回归模型。
三举例说明
下面用一个例子来说明 SPSS 中 Cox 回归模型的操作方法。
例题:研究胰腺癌术中放疗对患者生存时间的影响
收集了下面所示的数据:
操作步骤:
SPSS 变量视图:
菜单选择:
点击进入 Cox 主对话框,如下,将 time 选入「时间」框,将代表删失的 censor 变量选入「状态」框,其余分析变量选入「协变量」框,其余默认就行。
点击「状态」框下方的「定义事件」,将事件发生的标志设为值 0,即 0 代表事件发生。
在主对话框中点击「分类」按钮,进入如下的对话框,将所有分类变量选入右边框中。
在主对话框中点击「绘图」按钮,进入如下的对话框,选择绘图的类型,这里只选择「生存函数」。由于我们关心的主要变量是 trt(是否放疗),所以将 trt 选入「单线」框中,绘制生存曲线。
在主对话框中点击「选项」按钮,进入如下的对话框,设置如下,输出 RR 的 95% 置信区间。回到主界面,点击「确定」输出结果。
结果输出:
这是案例处理摘要,有一个删失数据。
这是分类变量的编码方式。
这是对拟合模型的检验,原假设是「所有影响因素的偏回归系数均为 0」,这里可以看出 P=0.032<0.05 拒绝原假设,认为有偏回归系数不为零的因素,值得进一步分析。
这是多元回归结果,第二列 B 为偏回归系数,最后三列为 OR 值及其置信区间。由 P 值可以看出,在 0.5 的显著水平下,只有 trt 有统计学差异,OR 为 2.265。
这是协变量的平均值。
这是总体的生存函数,即累积生存率函数。
这是在控制了其他变量后,有无放疗组的生存函数对比,可以看出,术中放疗患者的生存情况优于不放疗的患者。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
【核心关键词】软件、洞察力、大数据、产品、经验、硬件、流量、创新、决策、数据安全、网络安全、数据分析、决策制定、数据挖 ...
2026-06-18在方案选型、效果复盘、产品评估、供应商筛选等各类业务决策场景中,仅凭单一指标下结论往往会陷入 “以偏概全” 的误区。多维度 ...
2026-06-18 很多数据分析师精通Excel单元格操作,但当被问到“表结构数据的基本处理单位是什么”“字段和记录的本质区别”“为什么表结 ...
2026-06-18在数据分析、用户运营与业务增长的工作体系中,漏斗拆解是最基础也最高频的问题定位方法。很多业务场景下,我们只能看到最终的转 ...
2026-06-17在数据库开发、数据清洗与报表统计场景中,数值类型转换为日期是高频刚需操作。业务系统常以 Unix 时间戳、整型日期(如20240617 ...
2026-06-17 数据分析师八成以上的时间在和数据表格打交道,但许多人拿到Excel后习惯性地先算、先分析,结果回头发现漏了一列关键数据, ...
2026-06-17【核心关键词】数据库、电商、知识、产品、数据产品、监管业务、产品经理、业务系统、用户行为分析、用户分析、数据分析、电商 ...
2026-06-16在 Python 动态类型与面向对象的编程体系中,变量定义与类实例化是构建代码逻辑的两大核心基石。变量是数据存储、传递与运算的基 ...
2026-06-16 很多数据分析师每天与Excel打交道,但当被问到“表格结构数据和表结构数据有什么区别”“数据类型误判会引发哪些分析错误” ...
2026-06-16在 MySQL 查询性能优化体系中,索引是降低查询耗时、提升数据库吞吐的核心手段。其中联合索引与覆盖索引是实际开发中最高频的两 ...
2026-06-15在数据仓库建设与商业智能分析体系中,维度建模是应用最广泛的建模方法论,而事实表与维度表是维度建模的两大核心构件,共同构成 ...
2026-06-15 很多数据分析师能熟练计算指标,但当被问到“这家企业的核心业务目标是什么”“如何把模糊的战略目标拆解为可量化的指标”“ ...
2026-06-15在数据分析、业务监控、运营复盘等场景中,列值趋势计算是核心需求之一。无论是分析销售额的月度增长、用户活跃的变化趋势、库存 ...
2026-06-12在数字经济深度渗透的当下,消费者的购买行为已从过去的 “被动接受” 转变为 “主动决策”。流量红利消退、获客成本攀升、用户 ...
2026-06-12CDA三级认证是三个级别中的塔尖,全面考察数据战略、团队领导和复杂项目的综合能力。它所对应的《敏捷数据挖掘》教材,不再局限 ...
2026-06-12在游戏产业的商业逻辑中,付费玩家是支撑游戏生存与发展的核心支柱。行业普遍遵循 “二八定律”:20% 的付费玩家贡献了游戏 80% ...
2026-06-11【核心关键词】企业、定位、传统、产品、互联网、可视化、业务侧、数字化、结构化、数据分析、传统制造业、市场状态、发展空间 ...
2026-06-11 解读《CDA二级教材:量化策略分析(2025)》的全景结构与学习逻辑 ” CDA二级认证是企业招聘数据分析师时最常提及的证书门槛 ...
2026-06-11【核心关键词】药企、可视化、营销、分类、数据分析师、销售数据、业务人员、指导方向、分析报告、营销数据、营销医生 【专访摘 ...
2026-06-10在统计学分析、问卷调研、实验验证、业务复盘等场景中,卡方检验与 T 检验是应用最广泛的两类基础假设检验方法。前者专门处理分 ...
2026-06-10