没有可对比性的数据分析就是耍流氓
在数据分析的对比、细分、溯源六字箴言中,对比占据着重要的地位,也是最简单的数据分析方法之一,可以说无对比不分析,但是没有可对比性的对比一定是耍流氓。
没有可对比性的案例无处不在,在《统计数字会撒谎》一书中提到一个案例,在美国和西班牙交战期间,美国海军的死亡率是9‰,而同时期纽约居民的死亡率是16‰,于是美国海军征兵海报口号就是:来参军吧,参军更安全!
这个案例问题在于9‰和16‰这两个数据没有可对比性,当兵的人群都是年轻力壮的,一般只会战死,而纽约居民却是各式各样,有自然死亡的、老弱病残而死的、交通事故致死的等。
之前正好看见一条新闻,题目就是《建筑工地民工月薪最高1.4万秒杀白领》。这显然是标题党干的,用民工最高工资和白领对比这也是没有对比性的。
数据可对比性的四个“一致”原则:
1、对象一致
前面征兵那个案例就是属于对比的对象不一致。
2、时间属性一致
A公司的销售员离职率是12%,B公司的销售员的离职率是4%,如果你据此就认为B公司的人员更稳定的话就大错特错了,你必须要再问一下他们的时间属性是否是一致的,是否都是月离职率或年离职率等。
3、定义和计算方法一致
我给你俩举一个典型案例,关于“青年”的定义。我查阅了大量的资料,发现至少有六种对青年的定义。国家统计局“青年”的定义为15-34岁为青年人口(用于人口普查);共青团的相关定义为14-28岁为青年人口(这是《团章》中的规定);青联的相关规定为18-40岁为青年人口(见青联章程);国务院的规定五四青年节为14-28周岁的青年放假半天;而联合国人口基金定义为14-25岁,世界卫生组织的标准又是14-44岁为青年人口。如果下次你们看见我国青年人占人口总数的**%的数据,一定要问一下它的青年定义是什么。
4、数据源一致:
数据源不一致产生的差异一般比较隐蔽。
对比虽然是最简单的分析方法,但是使用之前一定要慎重,一定要考虑清楚,一定要坚守可对比性的原则。
被滥用的同比和环比
对比是最常用的分析方法,而同比和环比又是对比中最常用的两种分析方法。同比是本期和去年同期的对比,环比是本期和上一期的对比。例如2015年12月和2014年12月的对比是同比,和2015年11月的对比是环比,这是统计学上的定义,但在实际业务中同比和环比则会复杂一些,实际业务过程中也经常被滥用。
问:在零售业的日销售分析中2016年7月12日的零售额同比是否应该是对比2015年7月12日的零售额?
考虑到具体的行业就不是这样算同比了。具体到零售业2016年7月12日和2015年7月12日的零售额并没有实际的对比意义。因为2016年的这一天是星期二,而2015年7月12日却是周日,对零售企业来说这是不同业务背景的日子,所以不能简单的按统计学的定义来对比。我认为和2015年7月14日的零售额对比更有意义,因为都是星期二。
数据分析必须在业务中灵活应用才有意义。对于零售企业来说日零售额的同比应该首先遵循星期几对比星期几的原则,其次应该遵循节日原则,如中秋对比中秋、端午对比端午、除夕对比除夕、情人节对比情人节、圣诞对比圣诞等,最后应该遵循假日放假规则,如十一放假第一天和上年十一放假第一天对比等。不过现在的销售分析软件基本上是按照统计学的定义来设定对比原则的,不能不说是一个遗憾。需要注意,这里说的是零售企业,不过餐饮业、电子商务等也应该遵循这个原则。
问:2016年2月的零售额同比2015年2月的零售额同比有意义吗?
二者可以对比,不过没有太大的业务意义。首先2016年2月是29天,2015年2月是28天,其次春节假期的因素,对零售企业来说这两个因素都是影响零售额的重要因素。所以这两个月的零售数据同比没有多大意义,同比增长率也没有太大实际意义。
上面这两个实例都属于违背了之前对比原则中提到的时间属性一致的原则。另外,我们再看一下2013年11月和2012年11月,这两个月都是30天,并且没有其他特定节日干扰,是不是他们就有严格的同比意义了呢?
首先这两个月的可对比性大大超过前两组日期,但如果你们俩仔细观察的话,一定会发现2013年11月有9天周末休息日,而2012年11月只有8天,少一个休息日对传统零售业来说意义可不小。按照周销售指数的概念来计算,在没有其他因素影响的前提下,因为2013年11月多一个休息日,零售额相应会多2-3%。如果某个店铺恰好11月的同比增长是2-3%,你必须要明白,这增长的零售额是时间属性赋予的。
如果照这样分析,是不是所有的月份同比零售额都没有对比意义了?
当然不是,同比是一种统计方法,只要符合统计学定义都可以做对比分析,只是作为数据分析人员,你们必须了解对比结果在业务层面的实际意义的大小,一定要知道数据背后的故事。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
数据分析在当今信息时代发挥着重要作用。单因素方差分析(One-Way ANOVA)是一种关键的统计方法,用于比较三个或更多独立样本组 ...
2025-04-25CDA持证人简介: 居瑜 ,CDA一级持证人国企财务经理,13年财务管理运营经验,在数据分析就业和实践经验方面有着丰富的积累和经 ...
2025-04-25在当今数字化时代,数据分析师的重要性与日俱增。但许多人在踏上这条职业道路时,往往充满疑惑: 如何成为一名数据分析师?成为 ...
2025-04-24以下的文章内容来源于刘静老师的专栏,如果您想阅读专栏《刘静:10大业务分析模型突破业务瓶颈》,点击下方链接 https://edu.cda ...
2025-04-23大咖简介: 刘凯,CDA大咖汇特邀讲师,DAMA中国分会理事,香港金管局特聘数据管理专家,拥有丰富的行业经验。本文将从数据要素 ...
2025-04-22CDA持证人简介 刘伟,美国 NAU 大学计算机信息技术硕士, CDA数据分析师三级持证人,现任职于江苏宝应农商银行数据治理岗。 学 ...
2025-04-21持证人简介:贺渲雯 ,CDA 数据分析师一级持证人,互联网行业数据分析师 今天我将为大家带来一个关于用户私域用户质量数据分析 ...
2025-04-18一、CDA持证人介绍 在数字化浪潮席卷商业领域的当下,数据分析已成为企业发展的关键驱动力。为助力大家深入了解数据分析在电商行 ...
2025-04-17CDA持证人简介:居瑜 ,CDA一级持证人,国企财务经理,13年财务管理运营经验,在数据分析实践方面积累了丰富的行业经验。 一、 ...
2025-04-16持证人简介: CDA持证人刘凌峰,CDA L1持证人,微软认证讲师(MCT)金山办公最有价值专家(KVP),工信部高级项目管理师,拥有 ...
2025-04-15持证人简介:CDA持证人黄葛英,ICF国际教练联盟认证教练,前字节跳动销售主管,拥有丰富的行业经验。在实际生活中,我们可能会 ...
2025-04-14在 Python 编程学习与实践中,Anaconda 是一款极为重要的工具。它作为一个开源的 Python 发行版本,集成了众多常用的科学计算库 ...
2025-04-14随着大数据时代的深入发展,数据运营成为企业不可或缺的岗位之一。这个职位的核心是通过收集、整理和分析数据,帮助企业做出科 ...
2025-04-11持证人简介:CDA持证人黄葛英,ICF国际教练联盟认证教练,前字节跳动销售主管,拥有丰富的行业经验。 本次分享我将以教培行业为 ...
2025-04-11近日《2025中国城市长租市场发展蓝皮书》(下称《蓝皮书》)正式发布。《蓝皮书》指出,当前我国城市住房正经历从“增量扩张”向 ...
2025-04-10在数字化时代的浪潮中,数据已经成为企业决策和运营的核心。每一位客户,每一次交易,都承载着丰富的信息和价值。 如何在海量客 ...
2025-04-09数据是数字化的基础。随着工业4.0的推进,企业生产运作过程中的在线数据变得更加丰富;而互联网、新零售等C端应用的丰富多彩,产 ...
2025-04-094月7日,美国关税政策对全球金融市场的冲击仍在肆虐,周一亚市早盘,美股股指、原油期货、加密货币、贵金属等资产齐齐重挫,市场 ...
2025-04-08背景 3月26日,科技圈迎来一则重磅消息,苹果公司宣布向浙江大学捐赠 3000 万元人民币,用于支持编程教育。 这一举措并非偶然, ...
2025-04-07在当今数据驱动的时代,数据分析能力备受青睐,数据分析能力频繁出现在岗位需求的描述中,不分岗位的任职要求中,会特意标出“熟 ...
2025-04-03