
统计学的七大支柱_数据分析师培训
JSM上统计界的老帮主Stephen Stigler做了一个主题演讲,讲“统计学的七大支柱”,好心又认真的Rick Wicklin同学记了笔记,彼时估计还在中国城吃饭的我才得以了解SS大人到底讲了什么。回头看看笔记,我觉得SS大人有点吹嘘统计学之嫌。所谓支柱,就是没了它咱就垮了。七大支柱为:
汇总:我们从数据汇总中获得知识。本小子认为汇总是统计的经典用途,但汇总(描述统计)只是统计学的一方面,另一个同样重要也相对更靠谱一些的方面是预测。我从来都是扬预测而抑汇总的,因为统计学生来就带有不靠谱的本性,汇总搞错了无从查证,预测错了一定程度上我们还是知道错了多远的。
边际效应递减:随着数据量增大,信息量并不是线性增加,而是到了一定程度之后可能就没太多新的信息了。SS大人用n(样本量)的平方根来形容这个递减,我觉得太牵强了,例如样本均值的标准误里有个n的平方根,但这跟信息有毛线关系呢?
似然/概率:概率论当然是统计学的支柱,当然也要取决于我们怎么定义统计学,但说概率是数理统计的基础肯定不会有人不同意。有人说统计是“研究不确定性的科学”,我现在最烦的就是“科学”二字,人人都把自己的工作升级为科学,尼玛什么是科学?我认为数学/数理统计可以是学科,但不是科学。要称自己的做的是科学,先问问那些养兔子和大肠杆菌的苦逼博士们再想想自己做的算不算科学。说自己研究的是一门学科又没什么丢人的,这年头神马“数据科学”,以及孟生旺老师讽刺的“数学科学学院”(一个名字里三个重复的字,直接叫“数学系”丢人吗?),都是一些没有底气的人才想出来的名词。我敬佩老老实实做实验的自然科学工作者,不是说用纸笔推公式的工作者做的是无意义的事情或者不苦逼,而是说没事不要在这些称谓上较劲,安分守己一点比较好。
横向比较:例如比较两样本均值的差异。SS大人讲别的学科是与“金标准”进行比较,而我们是在数据内部比较,如方差分析ANOVA和t检验。我没太明白这算什么支柱,而且统计里面也不是没有和“金标准”比较的情形啊。
回归和多元分析:身高的回归是经典例子了,这确实是一个有趣的发现,但现实中回归被用来做什么了呢?我感觉回归的主要作用是被铺天盖地的论文拿来当炮灰(你看,俺的方法比回归好),或者在外专业里面当万精油(你看,俺跑了个回归,系数显著耶)。与其说某种方法是支柱,不如说方法和领域知识的结合是支柱。没有具体的领域知识,跑个系数显著的回归只是盲人摸象。
试验设计:这个当然也很重要,我觉得这是七大支柱里唯一可以称为支柱的一个,因为它可以脱离领域知识而有效。没有比较就没有鉴别,大家都知道要比较,但怎么比是个关键问题。例如前些日子火爆的汉字听写大赛就违反了“随机”、“重复”、“对照”等试验设计基本原则,在缺乏概率指导下的竞赛,难免有些不公平。
模型和残差:这个有点局限于回归套路了,不是所有模型都涉及残差项的。若不检查残差的分布,统计学会不会垮掉?我认为未必。即使残差仍然有明显的特征,模型也未必完全不合适,这要看你想要获取模型中哪部分的信息。文章来源:CDA数据分析师官网
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
“纲举目张,执本末从。”若想在数据分析领域有所收获,一套合适的学习教材至关重要。一套优质且契合需求的学习教材无疑是那关键 ...
2025-06-092025 年,数据如同数字时代的 DNA,编码着人类社会的未来图景,驱动着商业时代的运转。从全球互联网用户每天产生的2.5亿TB数据, ...
2025-05-27CDA数据分析师证书考试体系(更新于2025年05月22日)
2025-05-26解码数据基因:从数字敏感度到逻辑思维 每当看到超市货架上商品的排列变化,你是否会联想到背后的销售数据波动?三年前在零售行 ...
2025-05-23在本文中,我们将探讨 AI 为何能够加速数据分析、如何在每个步骤中实现数据分析自动化以及使用哪些工具。 数据分析中的AI是什么 ...
2025-05-20当数据遇见人生:我的第一个分析项目 记得三年前接手第一个数据分析项目时,我面对Excel里密密麻麻的销售数据手足无措。那些跳动 ...
2025-05-20在数字化运营的时代,企业每天都在产生海量数据:用户点击行为、商品销售记录、广告投放反馈…… 这些数据就像散落的拼图,而相 ...
2025-05-19在当今数字化营销时代,小红书作为国内领先的社交电商平台,其销售数据蕴含着巨大的商业价值。通过对小红书销售数据的深入分析, ...
2025-05-16Excel作为最常用的数据分析工具,有没有什么工具可以帮助我们快速地使用excel表格,只要轻松几步甚至输入几项指令就能搞定呢? ...
2025-05-15数据,如同无形的燃料,驱动着现代社会的运转。从全球互联网用户每天产生的2.5亿TB数据,到制造业的传感器、金融交易 ...
2025-05-15大数据是什么_数据分析师培训 其实,现在的大数据指的并不仅仅是海量数据,更准确而言是对大数据分析的方法。传统的数 ...
2025-05-14CDA持证人简介: 万木,CDA L1持证人,某电商中厂BI工程师 ,5年数据经验1年BI内训师,高级数据分析师,拥有丰富的行业经验。 ...
2025-05-13CDA持证人简介: 王明月 ,CDA 数据分析师二级持证人,2年数据产品工作经验,管理学博士在读。 学习入口:https://edu.cda.cn/g ...
2025-05-12CDA持证人简介: 杨贞玺 ,CDA一级持证人,郑州大学情报学硕士研究生,某上市公司数据分析师。 学习入口:https://edu.cda.cn/g ...
2025-05-09CDA持证人简介 程靖 CDA会员大咖,畅销书《小白学产品》作者,13年顶级互联网公司产品经理相关经验,曾在百度、美团、阿里等 ...
2025-05-07相信很多做数据分析的小伙伴,都接到过一些高阶的数据分析需求,实现的过程需要用到一些数据获取,数据清洗转换,建模方法等,这 ...
2025-05-06以下的文章内容来源于刘静老师的专栏,如果您想阅读专栏《10大业务分析模型突破业务瓶颈》,点击下方链接 https://edu.cda.cn/g ...
2025-04-30CDA持证人简介: 邱立峰 CDA 数据分析师二级持证人,数字化转型专家,数据治理专家,高级数据分析师,拥有丰富的行业经验。 ...
2025-04-29CDA持证人简介: 程靖 CDA会员大咖,畅销书《小白学产品》作者,13年顶级互联网公司产品经理相关经验,曾在百度,美团,阿里等 ...
2025-04-28CDA持证人简介: 居瑜 ,CDA一级持证人国企财务经理,13年财务管理运营经验,在数据分析就业和实践经验方面有着丰富的积累和经 ...
2025-04-27