
在数据分析工作中,你可能经常遇到这样的问题:
从浏览到消费的转化率一直很低,那到底该优化哪里呢?
如果你要投放广告该怎么选择对象人群呢?
遇到类似的问题,我们需要将具体的业务问题和数据之间建立一种关系,然后通过一些分析方法和分析工具,让我们在遇到此类问题时知道:我该选择什么样的分析工具或分析方法去解决实际业务中的问题。
俗话说:没有对比就没有伤害。数据分析的最终目的是对现实的情况或一个功能的好坏做评估,这里最常用的方法就是对比分析法啦。
举个例子来说,2020财年淘宝天猫GMV达成6.589万亿,如果没有对比GMV只是一个数字而已,我们并不知道这个数字代表的业务状况到底如何,业务是增长了呢,还是衰退了呢?如果我们把前三财年的GMV数据也放上,就会发现2020财年的GMV是增长的,从这个对比数据来看业务是稳定上升的。这就是对比分析在数据分析中的作用,没有对比就没有数据结论!
接下来介绍对比分析法中的三个问题:比什么?如何比?跟谁比?
绝对值是本身就具备价值的数字 ,比如:电商平台的销售金额、公众号的阅读数等。当然,如果只看绝对值,是无法得知事情严重到什么程度的。
在具体环境中看比例值才具备对比价值,比如:电商平台的详情页转化率,复购率等。需要注意的是:比例值是一个除法计算,很容易把数量级的一些数字给忽略了,比如说:85除100和85000除100000得到的都是同样的值。
数据对比分析是数据分析岗最常用的方法。
环比是与当前时间范围相邻的上一个时间范围对比。
以下图为例:如果是日环比,则是拿星期二的数据与星期一的数据比,同理,周环比呢,则是拿本周的数据和上一周的数据对比,那月环比自然也是拿本月的数据与上一个月的数据对比了。
环比适合分析短期内具备连续性数据的业务场景。 举个栗子:比如说我们要做一个为期10天促销活动,在做这个活动的过程中,每天都会去观察活动的效果,根据前一天的活动效果来优化后面的活动过程,而这个活动之前没有做过,没法与以前的活动效果进行对比,这个时候就要看日环比数据了。
环比适用于根据相邻时间范围的数字对当前时间范围的指标进行设定。
比如给我们的产品设定每月新增用户为100000,但是第一月我们只做到10000,第二个月只做到12000,那我们就需要跟据前面两月的实际情况进行对比,调整第三个月及之后的目标了。
同比是与当前时间范围上层时间范围的前一范围中同样位置数据对比。
举个栗子:今天是4月16日(当前时间范围),月同比就是选择3月16日来同4月16日进行同比计算。
同比的使用场景有:打赏的流水、销售流水等。像旅行、餐饮、骑行这些会受季节性影响的产品,会拿今年的这个日/月或一个时间段跟去年的同期进行比较。
同比更适合去观察长期的数据集。
举个栗子:公司每年都会进行“双十一”大促,这个时候我们对比数据时可以把今年的同去年的,或者去年同前年的数据进行对比。
同比适用于观察的时间周期里有较多干扰,而我们希望某种程度上消除这些干扰。比如说短视频类的产品,是不是需要考虑工作日和周末以及其他节假日呢。
对比分析法的特点是:可以非常直观地看出事物某方面的变化或差距,并且可以准确、量化地表示出这种变化或差距是多少。
确定对比的对象是数据分析的第一步。
对比的对象可以是自己,也可以是行业。如果是和自己比的话,可以通过某段时间的业务平均值、中位数等统计指标来衡量业务的整体大小;也可以通过变异系数来衡量业务整体的波动;同时也可以使用同比、环比等指标来衡量业务的变化趋势。如果是和行业比较的话,可以通过行业趋势与业务发展趋势进行对比,以判断业务发展是否健康;当然也可以和行业的金标准进行对比,以确定业务发展是否达到行业标准,进而调整业务发展方向和策略!
时间维度:拿昨天跟前天比,拿这个星期跟上个星期比(环比、同比)等等。简单说一下同比的环比的区别,如图片。
不同业务线:跟公司不同的业务线进行对比,比如说做线上汽车交易的,拿新车和二手车比。二手车数据涨跌厉害,那新车有这种情况吗?
往期均值:这里不同于时间维度,像留存、销售额、日活这些都是比较连续的数据,每天都会产生新的指标。但是有很多事情不是连续性的,它不会每天都产生数据,这个时候就要根据往期这些数据的均值进行对比。
结合实际的业务场景,指标上升、下降、持续保持波动没有变化或大幅波动等,都能够称之为某种程度上的问题。
2.和行业比
在实际的业务中,如果跟自己比找不到原因,那么就需要跟行业比,看是自身的原因,还是行业的趋势导致的跌或者涨。
都跌:如果都跌,咱能不能比同行跌得少?
举个栗子:A公司的跌了10%,咱们公司跌了30%,那么在这个相对竞争的环境中,咱跌的是更多的,通过这样的对比,就可以找到原因并解决这个问题。
都涨:如果都涨,咱能不能比同行涨得快?
都涨也是一样的道理,如果A公司涨了30%,咱们只涨了10%,也能找到原因,并给出解决方案。因为如果不这样做,那么相对于竞争对手而言,咱还是在跌的。
2025年,是数据时代的新起点,也是职业探索的新征程。
以上的文章内容来源于柯家媛老师的专栏,如果您想阅读专栏《业务数据分析模型》,点击下方链接
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
t 检验与 Wilcoxon 检验:数据差异比较的两大统计利器 在数据分析中,“比较差异” 是核心需求之一 —— 如新药疗效是否优于旧药 ...
2025-08-26季节性分解外推法:解锁时间序列预测的规律密码 在商业决策、资源调度、政策制定等领域,准确的预测是规避风险、提升效率的关键 ...
2025-08-26CDA 数据分析师:数据治理驱动下的企业数据价值守护者 在数字经济时代,数据已成为企业核心战略资产,其价值的释放离不开高 ...
2025-08-26基于 SPSS 的 ROC 曲线平滑调整方法与实践指南 摘要 受试者工作特征曲线(ROC 曲线)是评估诊断模型或预测指标效能的核心工具, ...
2025-08-25神经网络隐藏层神经元个数的确定方法与实践 摘要 在神经网络模型设计中,隐藏层神经元个数的确定是影响模型性能、训练效率与泛 ...
2025-08-25CDA 数据分析师与数据思维:驱动企业管理升级的核心力量 在数字化浪潮席卷全球的当下,数据已成为企业继人力、物力、财力之后的 ...
2025-08-25CDA数据分析师与数据指标:基础概念与协同逻辑 一、CDA 数据分析师:数据驱动时代的核心角色 1.1 定义与行业价值 CDA(Certified ...
2025-08-22Power Query 移动加权平均计算 Power Query 移动加权平均设置全解析:从原理到实战 一、移动加权平均法的核心逻辑 移动加权平均 ...
2025-08-22描述性统计:CDA数据分析师的基础核心与实践应用 一、描述性统计的定位:CDA 认证的 “入门基石” 在 CDA(Certified Data Analy ...
2025-08-22基于 Python response.text 的科技新闻数据清洗去噪实践 在通过 Python requests 库的 response.text 获取 API 数据后,原始数据 ...
2025-08-21基于 Python response.text 的科技新闻综述 在 Python 网络爬虫与 API 调用场景中,response.text 是 requests 库发起请求后获取 ...
2025-08-21数据治理新浪潮:CDA 数据分析师的战略价值与驱动逻辑 一、数据治理的多维驱动引擎 在数字经济与人工智能深度融合的时代,数据治 ...
2025-08-21Power BI 热力地图制作指南:从数据准备到实战分析 在数据可视化领域,热力地图凭借 “直观呈现数据密度与分布趋势” 的核心优势 ...
2025-08-20PyTorch 矩阵运算加速库:从原理到实践的全面解析 在深度学习领域,矩阵运算堪称 “计算基石”。无论是卷积神经网络(CNN)中的 ...
2025-08-20数据建模:CDA 数据分析师的核心驱动力 在数字经济浪潮中,数据已成为企业决策的核心资产。CDA(Certified Data Analyst)数据分 ...
2025-08-20KS 曲线不光滑:模型评估的隐形陷阱,从原因到破局的全指南 在分类模型(如风控违约预测、电商用户流失预警、医疗疾病诊断)的评 ...
2025-08-20偏态分布:揭开数据背后的非对称真相,赋能精准决策 在数据分析的世界里,“正态分布” 常被视为 “理想模型”—— 数据围绕均值 ...
2025-08-19CDA 数据分析师:数字化时代的价值创造者与决策智囊 在数据洪流席卷全球的今天,“数据驱动” 已从企业战略口号落地为核心 ...
2025-08-19CDA 数据分析师:善用 Power BI 索引列,提升数据处理与分析效率 在 Power BI 数据分析流程中,“数据准备” 是决定后续分析质量 ...
2025-08-18CDA 数据分析师:巧用 SQL 多个聚合函数,解锁数据多维洞察 在企业数据分析场景中,单一维度的统计(如 “总销售额”“用户总数 ...
2025-08-18