CDA持证人阿涛哥

2022-07-16   阅读量: 453

统计学

什么是辛普森悖论?

扫码加入数据分析学习群

“狡猾”的数据-辛普森悖论
先来做个选择感受一下:
A医院:1000病人,900活,100死,存活率90%
B医院:1000病人,800活,200死,存活率80%
你会选择哪家医院?
1、 肯定A医院啊,存活率更高
2、 犹豫一下B医院,存活率也不低
3、 观望观望,具体问题具体分析


若你简单选择了A医院,此时你就中了“狡猾”数据的计了
为什么?让我们来将重症患者于轻症患者分开看看:
A医院:100重症,30活,70死,存活率30%;900轻症,870活,30死,存活率96.7%
B医院:400重症,210活,190死,存活率52.5%;600轻症,590活,10死,存活率98.3:

很明显,无论是轻症还是重症,B医院的存活率都高于A医院。
所以,
如果只看总体的存活率,A医院是个不错的选择
但区分了轻重症患者后,更好的选择则变成了B医院。
这就体现了辛普森悖论——即是指同一组数据,在分开讨论时和合并讨论时得出的结果可能截然不同。这种不符合常规认知的“悖论”现象,在数据分析领域并不少见。

0.0000 2 0 关注作者 收藏

评论(0)


暂无数据

推荐课程

推荐帖子