
在数据分析工作中,你可能经常遇到这样的问题:
从浏览到消费的转化率一直很低,那到底该优化哪里呢?
如果你要投放广告该怎么选择对象人群呢?
遇到类似的问题,我们需要将具体的业务问题和数据之间建立一种关系,然后通过一些分析方法和分析工具,让我们在遇到此类问题时知道:我该选择什么样的分析工具或分析方法去解决实际业务中的问题。
俗话说:没有对比就没有伤害。数据分析的最终目的是对现实的情况或一个功能的好坏做评估,这里最常用的方法就是对比分析法啦。
举个例子来说,2020财年淘宝天猫GMV达成6.589万亿,如果没有对比GMV只是一个数字而已,我们并不知道这个数字代表的业务状况到底如何,业务是增长了呢,还是衰退了呢?如果我们把前三财年的GMV数据也放上,就会发现2020财年的GMV是增长的,从这个对比数据来看业务是稳定上升的。这就是对比分析在数据分析中的作用,没有对比就没有数据结论!
接下来介绍对比分析法中的三个问题:比什么?如何比?跟谁比?
绝对值是本身就具备价值的数字 ,比如:电商平台的销售金额、公众号的阅读数等。当然,如果只看绝对值,是无法得知事情严重到什么程度的。
在具体环境中看比例值才具备对比价值,比如:电商平台的详情页转化率,复购率等。需要注意的是:比例值是一个除法计算,很容易把数量级的一些数字给忽略了,比如说:85除100和85000除100000得到的都是同样的值。
数据对比分析是数据分析岗最常用的方法。
环比是与当前时间范围相邻的上一个时间范围对比。
以下图为例:如果是日环比,则是拿星期二的数据与星期一的数据比,同理,周环比呢,则是拿本周的数据和上一周的数据对比,那月环比自然也是拿本月的数据与上一个月的数据对比了。
环比适合分析短期内具备连续性数据的业务场景。 举个栗子:比如说我们要做一个为期10天促销活动,在做这个活动的过程中,每天都会去观察活动的效果,根据前一天的活动效果来优化后面的活动过程,而这个活动之前没有做过,没法与以前的活动效果进行对比,这个时候就要看日环比数据了。
环比适用于根据相邻时间范围的数字对当前时间范围的指标进行设定。
比如给我们的产品设定每月新增用户为100000,但是第一月我们只做到10000,第二个月只做到12000,那我们就需要跟据前面两月的实际情况进行对比,调整第三个月及之后的目标了。
同比是与当前时间范围上层时间范围的前一范围中同样位置数据对比。
举个栗子:今天是4月16日(当前时间范围),月同比就是选择3月16日来同4月16日进行同比计算。
同比的使用场景有:打赏的流水、销售流水等。像旅行、餐饮、骑行这些会受季节性影响的产品,会拿今年的这个日/月或一个时间段跟去年的同期进行比较。
同比更适合去观察长期的数据集。
举个栗子:公司每年都会进行“双十一”大促,这个时候我们对比数据时可以把今年的同去年的,或者去年同前年的数据进行对比。
同比适用于观察的时间周期里有较多干扰,而我们希望某种程度上消除这些干扰。比如说短视频类的产品,是不是需要考虑工作日和周末以及其他节假日呢。
对比分析法的特点是:可以非常直观地看出事物某方面的变化或差距,并且可以准确、量化地表示出这种变化或差距是多少。
确定对比的对象是数据分析的第一步。
对比的对象可以是自己,也可以是行业。如果是和自己比的话,可以通过某段时间的业务平均值、中位数等统计指标来衡量业务的整体大小;也可以通过变异系数来衡量业务整体的波动;同时也可以使用同比、环比等指标来衡量业务的变化趋势。如果是和行业比较的话,可以通过行业趋势与业务发展趋势进行对比,以判断业务发展是否健康;当然也可以和行业的金标准进行对比,以确定业务发展是否达到行业标准,进而调整业务发展方向和策略!
时间维度:拿昨天跟前天比,拿这个星期跟上个星期比(环比、同比)等等。简单说一下同比的环比的区别,如图片。
不同业务线:跟公司不同的业务线进行对比,比如说做线上汽车交易的,拿新车和二手车比。二手车数据涨跌厉害,那新车有这种情况吗?
往期均值:这里不同于时间维度,像留存、销售额、日活这些都是比较连续的数据,每天都会产生新的指标。但是有很多事情不是连续性的,它不会每天都产生数据,这个时候就要根据往期这些数据的均值进行对比。
结合实际的业务场景,指标上升、下降、持续保持波动没有变化或大幅波动等,都能够称之为某种程度上的问题。
2.和行业比
在实际的业务中,如果跟自己比找不到原因,那么就需要跟行业比,看是自身的原因,还是行业的趋势导致的跌或者涨。
都跌:如果都跌,咱能不能比同行跌得少?
举个栗子:A公司的跌了10%,咱们公司跌了30%,那么在这个相对竞争的环境中,咱跌的是更多的,通过这样的对比,就可以找到原因并解决这个问题。
都涨:如果都涨,咱能不能比同行涨得快?
都涨也是一样的道理,如果A公司涨了30%,咱们只涨了10%,也能找到原因,并给出解决方案。因为如果不这样做,那么相对于竞争对手而言,咱还是在跌的。
2025年,是数据时代的新起点,也是职业探索的新征程。
以上的文章内容来源于柯家媛老师的专栏,如果您想阅读专栏《业务数据分析模型》,点击下方链接
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在神经网络模型设计中,“隐藏层层数” 是决定模型能力与效率的核心参数之一 —— 层数过少,模型可能 “欠拟合”(无法捕捉数据 ...
2025-10-14在数字化浪潮中,数据分析师已成为企业 “从数据中挖掘价值” 的核心角色 —— 他们既要能从海量数据中提取有效信息,又要能将分 ...
2025-10-14在企业数据驱动的实践中,“指标混乱” 是最常见的痛点:运营部门说 “复购率 15%”,产品部门说 “复购率 8%”,实则是两者对 ...
2025-10-14在手游行业,“次日留存率” 是衡量一款游戏生死的 “第一道关卡”—— 它不仅反映了玩家对游戏的初始接受度,更直接决定了后续 ...
2025-10-13分库分表,为何而生? 在信息技术发展的早期阶段,数据量相对较小,业务逻辑也较为简单,单库单表的数据库架构就能够满足大多数 ...
2025-10-13在企业数字化转型过程中,“数据孤岛” 是普遍面临的痛点:用户数据散落在 APP 日志、注册系统、客服记录中,订单数据分散在交易 ...
2025-10-13在数字化时代,用户的每一次行为 —— 从电商平台的 “浏览→加购→购买”,到视频 APP 的 “打开→搜索→观看→收藏”,再到银 ...
2025-10-11在机器学习建模流程中,“特征重要性分析” 是连接 “数据” 与 “业务” 的关键桥梁 —— 它不仅能帮我们筛选冗余特征、提升模 ...
2025-10-11在企业的数据体系中,未经分类的数据如同 “杂乱无章的仓库”—— 用户行为日志、订单记录、商品信息混杂存储,CDA(Certified D ...
2025-10-11在 SQL Server 数据库操作中,“数据类型转换” 是高频需求 —— 无论是将字符串格式的日期转为datetime用于筛选,还是将数值转 ...
2025-10-10在科研攻关、工业优化、产品开发中,正交试验(Orthogonal Experiment)因 “用少量试验覆盖多因素多水平组合” 的高效性,成为 ...
2025-10-10在企业数据量从 “GB 级” 迈向 “PB 级” 的过程中,“数据混乱” 的痛点逐渐从 “隐性问题” 变为 “显性瓶颈”:各部门数据口 ...
2025-10-10在深度学习中,“模型如何从错误中学习” 是最关键的问题 —— 而损失函数与反向传播正是回答这一问题的核心技术:损失函数负责 ...
2025-10-09本文将从 “检验本质” 切入,拆解两种方法的核心适用条件、场景边界与实战选择逻辑,结合医学、工业、教育领域的案例,让你明确 ...
2025-10-09在 CDA 数据分析师的日常工作中,常会遇到这样的困惑:某电商平台 11 月 GMV 同比增长 20%,但究竟是 “长期趋势自然增长”,还 ...
2025-10-09Pandas 选取特定值所在行:6 类核心方法与实战指南 在使用 pandas 处理结构化数据时,“选取特定值所在的行” 是最高频的操作之 ...
2025-09-30球面卷积神经网络(SCNN) 为解决这一痛点,球面卷积神经网络(Spherical Convolutional Neural Network, SCNN) 应运而生。它通 ...
2025-09-30在企业日常运营中,“未来会怎样” 是决策者最关心的问题 —— 电商平台想知道 “下月销量能否达标”,金融机构想预判 “下周股 ...
2025-09-30Excel 能做聚类分析吗?基础方法、进阶技巧与场景边界 在数据分析领域,聚类分析是 “无监督学习” 的核心技术 —— 无需预设分 ...
2025-09-29XGBoost 决策树:原理、优化与工业级实战指南 在机器学习领域,决策树因 “可解释性强、处理非线性关系能力突出” 成为基础模型 ...
2025-09-29