生存曲线的估计方法（2）：生存率的95%置信区间-CDA数据分析师官网

热线电话：13121318867

首页大数据时代生存曲线的估计方法（2）：生存率的95%置信区间

生存曲线的估计方法（2）：生存率的95%置信区间

2020-11-10

作者：丁点helper

来源：丁点帮你

生存分析的上一篇文章主要通过一张表格介绍了计算生存率的方法，称作K-M法，也叫乘积极限法，简单来讲就是将生存概率相乘获得生存率。

生存曲线的估计方法（1）：先看懂这个表，比如，前面我们讲过：

好比身高的样本均数，抽取的第一拨人计算的平均身高和第二拨人的平均身高是有差异的。

因为它们都是样本统计量，所以会随着样本的变化而变化。同样地，如果我们想象一下，把这些样本统计量放在一起再求平均数和标准差，那这次得到的这个标准差叫做什么呢？

还记得吗？叫标准误。

在学习均数抽样分布的时候，我们也重点谈过的。

因此，类似的，根据样本计算的生存函数，它也是一个样本统计量，它也可以被计算标准误。

理解了这一层，就应该能搞懂上一篇文章中最后一列出现的“生存率标准误”，如下表第（9）列。

这个“生存率标准误”的计算公式稍微有些复杂，我们可以不详细展开。重点是大家要意识到它所代表的含义：

如果单单由一个样本的生存率去代表总体，会存在误差（类比用一个城市的平均身高代表全国的平均身高），如何去衡量这个误差？由此我们就计算了标准误。

因此，如果搞懂了前面讲的样本均数的标准误等概念，这里就直接类比即可，可见基本的统计学理论和知识点需要重点掌握。

之所以要大费周章地搞懂“生存率的标准误”这个概念，是因为在实际应用中，我们可能经常会面临计算生存率95%置信区间的问题。

同样地，原理和均数95%置信区间几乎完全类似。对这个知识点不熟悉的同学可以阅读我们发的这篇文章。

只要搞懂了置信区间的大逻辑，相信对下面这个生存率的95%置信区间计算公式不会陌生：

因此，我们可以得出：手术后辅助化疗的肺癌患者，10个月生存率的95%置信区间为（0.2848，0.8580），或者写成百分数的形式（28.48%，85.80%）。

讲完生存率置信区间的算法，我们再来复习之前介绍过的一个概念——中位生存时间。

如下图，可以发现，当时间 t=11.124时，对应的生存率是0.5。这表示，当生存时间是11.124个月时，生存函数取值为0.5，从而意味着：

上图有一个专业的名字，叫K-M生存曲线（对应前文讲过的K-M乘积极限法）：横轴是生存时间，纵轴是生存率。

从图中我们可以看出，K-M生存曲线呈阶梯性，随着生存时间的增加，曲线呈下降趋势，意味着时间越长，仍然存活的人数越少，生存率越低。如果曲线阶梯陡峭，表明下降速度快，往往生存期较短。

——热门课程推荐：

想学习PYTHON数据分析与金融数字化转型精英训练营，您可以点击>>>“人才转型”了解课程详情；

想从事业务型数据分析师，您可以点击>>>“数据分析师”了解课程详情；

想从事大数据分析师，您可以点击>>>“大数据就业”了解课程详情；

想成为人工智能工程师，您可以点击>>>“人工智能就业”了解课程详情；

想了解Python数据分析，您可以点击>>>“Python数据分析师”了解课程详情；

想咨询互联网运营，你可以点击>>>“互联网运营就业班”了解课程详情；

想了解更多优质课程，请点击>>>

CDA数据分析师考试相关入口一览（建议收藏）：

▷ 想报名CDA认证考试，点击>>> “CDA报名” 了解CDA考试详情；

▷ 想学习CDA考试教材，点击>>> “CDA教材” 了解CDA考试教材；

▷ 想加入CDA考试题库，点击>>> “CDA题库” 了解CDA考试题库；

▷ 想了解CDA考试含金量，点击>>> “CDA含金量” 了解CDA考试详情；

▷ 想了解CDA院校合作，点击>>> “院校合作” 了解咨询CDA院校合作；

数据分析标准差人工智能大数据大数据分析抽样分布

数据分析咨询请扫描二维码

若不方便扫码，搜微信号：CDAshujufenxi

上一篇让python在后台自动解压各种压缩文件！

下一篇时序数据处理难题攻略（上）

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

京公网安备 11010802034615号经营许可证编号：京B2-20210330

联系电话：13321103290 (微信同号)

客服在线

立即咨询

客服在线

立即咨询

免密码登录

提交首次登录验证后自动注册

生存曲线的估计方法（2）：生存率的95%置信区间

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

【CDA干货】一文搞定SQL字段varchar转double：语法 ...

【CDA干货】一文搞定数据透视表两列相互计算：从基 ...

表结构数据的获取、加工与使用：CDA数据分析师的核 ...

【CDA干货】AARRR用户增长漏斗模型全解析：从理论到 ...

【CDA干货】随机森林特征重要性分析全解析：从原理 ...

CDA数据分析师：精通表格结构数据核心功能，解锁高 ...

【CDA干货】一文读懂Excel箱线图含义：用简单图表解 ...

【CDA干货】ROC曲线阈值优化指南：如何科学提高阈值 ...

CDA数据分析师：以专业报告呈现，解锁数据洞察的落 ...

【CDA干货】主成分分析（PCA）实战全解析：从原理简 ...

【CDA干货】解析数据分析中基准比的本质：离基准值 ...

CDA数据分析师：驾驭业务数据分析全步骤，赋能业务 ...

【CDA干货】信贷违约率的统计分布特征与测算方法研 ...

【CDA干货】业务效果AB增量评估体系：搭建、实操与 ...

CDA数据分析师：以战略分析方法为翼，赋能企业长远 ...

【CDA干货】复杂抽样的统计描述：方法、要点与实操 ...

【CDA干货】详解聚合函数：可一次使用多个吗？实操 ...

CDA数据分析师视角：战略数据分析与业务数据分析的 ...

【CDA干货】详解B+树叶子节点指针：双向还是单向？ ...

【CDA干货】警惕！REPLACE(UUID(), '-', '')用于INS ...

CDA教育闭环

常见问题

关于我们

CDA数据分析师公众号

CDA考试中心小程序

CDA数据分析师App下载