刷抖音会影响学习吗？相关和因果初探-CDA数据分析师官网

热线电话：13121318867

首页精彩阅读刷抖音会影响学习吗？相关和因果初探

刷抖音会影响学习吗？相关和因果初探

2020-09-03

作者：丁点helper

来源：丁点帮你

前面，我们详述了各种检验方法的基本逻辑以及实操过程，包括t检验、方差分析、卡方检验、和基于秩次的非参数检验，从今天开始，我们就要进入一个新的主题——相关与回归。

相关与回归，尤其是后者，在卫生或医学统计学中应用的十分广泛。这两种方法都是在探寻两个或两个以上变量之间的关联，或者称“相关关系”。

可是，我们做研究的终极目标并非是为了获得“相关”，而是获得“因果”。

某种疾病病死率的下降与使用新药有关，这里的有关，实际上在暗示，新药的使用，导致了病死率的下降，这里的“导致”就表明产生了因果关系。

相关是比因果更宽泛的概念，两个变量存在因果关系，几乎可以肯定会存在相关关系（不限于线性相关）；但反过来，却不能成立，具有相关关系的数据，并不一定存在因果联系。

统计书中举的最简单的例子是“小树的身高和小孩的身高”——小树长、我也长，从数据来看，它们存在非常显著的相关关系。

但是，有何意义吗？并没有。我们并不能从这两个数据表面的相关来推导出小树身高对小孩身高造成何种影响？

是的，无论是简单的单因素假设检验（如两组样本的t检验），还是纳入了多个因素的线性回归分析，本质上，我们是希望获得一个因素对另一个因素的“影响”。

产生影响意味着什么呢？意味着发生了因果关系。

比如有人说“刷抖音影响学习”，把这句话用统计的语言来表达和验证就是：抽取一群学生，随机分配到两组，一组天天刷抖音，另一组不刷，然后比较两组学生的平均成绩。

如果抖音组的成绩低，那我们就可以下结论说：刷抖音影响学习，更准确地说，刷抖音导致学习成绩下降。同样，注意这里的用词，“导致”意味着因果关系。

以上当然是一个不严谨的“随机对照试验”，存在很多漏洞值得讨论。但我们举这个例子的意图只是想让大家明白，如果你想验证“因果关系”，理论上，这或许是唯一准确的办法。

再往深想一想，或许也不应该称为“理论上“唯一准确的办法，而应该称作“具有实现可能”的唯一准确办法。

言外之意，还有不可实现的方法吗？

是的，要做因果推断，最准确的应该是通过构造”反事实“来实现。

什么叫反事实？它是根据英文翻译过来的，叫做counterfactual facts，看第一个单次的词根”counter“就是”反、对抗“的意思。说起来似乎很拗口，但理解起来并不费劲。

仍以上面刷抖音和学习的例子来看，怎样通过构造”反事实“来探究这两者之间的因果关系呢？

很简单，让一个特别喜欢耍抖音的小朋友一直刷，然后记录其期末考试成绩；还是这个小朋友，让它做时光机重新回到学期开始的时候，什么都不变，唯独一点变了——没有抖音了，然后再看这个小朋友期末考试成绩。通过比较他的两次成绩，就能准确地判断出”刷抖音是否影响了他的学习“。

这就是所谓的”反事实“，因为他刷抖音这是个事实，在现实生活中，我们是无法改变这个事实的，所以只能通过在脑海中构建”他不刷抖音“这个反事实。实际上，因果推断的金标准——随机对照试验，就是一种模拟”反事实“的方法。

绕这么大一个圈给大家讲反事实，就是想提醒大家，因果关系推断之难。

别说反事实，就是随机对照试验，对很多研究来讲都是不可能实现的。

我们唯一（或者大部分）能获得就是眼前看到的这个世界发生的一切——所谓的”观察性数据“（Observational data），可我们的目的偏偏是希望从这些”观察性数据“中间获得”因果性推断“。

当我们采用统计方法来探究变量间的关系时，我们应该保持谨慎，因为几乎所有的方法都是在进行”相关关系“的探究，而非”因果关系“，这一点是我在咱们这个系列文章的开头想跟大家讲的。

CDA数据分析师考试相关入口一览（建议收藏）：

▷ 想报名CDA认证考试，点击>>> “CDA报名” 了解CDA考试详情；

▷ 想学习CDA考试教材，点击>>> “CDA教材” 了解CDA考试教材；

▷ 想加入CDA考试题库，点击>>> “CDA题库” 了解CDA考试题库；

▷ 想了解CDA考试含金量，点击>>> “CDA含金量” 了解CDA考试详情；

▷ 想了解CDA院校合作，点击>>> “院校合作” 了解咨询CDA院校合作；

方差分析线性回归方差回归分析假设检验非参数检验

数据分析咨询请扫描二维码

若不方便扫码，搜微信号：CDAshujufenxi

上一篇python到底是强类型语言，还是弱类型语言？

下一篇python之shutil模块11个常用函数详解

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

京公网安备 11010802034615号经营许可证编号：京B2-20210330

联系电话：13321103290 (微信同号)

客服在线

立即咨询

客服在线

立即咨询

免密码登录

提交首次登录验证后自动注册

刷抖音会影响学习吗？相关和因果初探

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

【CDA干货】指标：量化业务的核心衡量标准与设计指 ...

【CDA干货】Excel透视表计算字段：先乘法后求和汇总 ...

从“杂乱”到“有序”：CDA数据分析师视角下的数据 ...

CDA持证人专访：崔爱军谈地产行业数据治理与数据中 ...

【CDA干货】显著水平与P值的核心区别、关联关系及实 ...

为什么统计是数据分析师的“底层语言”？ ...

【CDA干货】数据分析核心技能体系：从工具落地到业 ...

【CDA干货】企业价值市场法价值比率与线性回归分析 ...

从“零散明细”到“多维洞察”：CDA数据分析师视角 ...

CDA持证人专访：赵君研谈金融行业数据分析与运营岗 ...

【CDA干货】多维度对比评估：分析逻辑与可视化效果 ...

从“静态数据”到“动态资产”：CDA数据分析师视角 ...

CDA持证人专访：贺译册谈产品经理的市场洞察力与数 ...

【CDA干货】多维度对比评估：分析逻辑与可视化效果 ...

从“单元格”到“字段”：CDA数据分析师视角下的表 ...

【CDA干货】漏斗拆解：核心逻辑、实操方法与业务优 ...

【CDA干货】SQL数值转日期函数全解析：主流数据库语 ...

数据分析必修课：CDA数据分析师视角下的表格结构数 ...

CDA持证人专访：杨旭谈数据产品经理的工作实践与核 ...

【CDA干货】Python变量定义与类实例化：核心原理、 ...

CDA教育闭环

常见问题

关于我们

CDA数据分析师公众号

CDA考试中心小程序

CDA数据分析师App下载