
简单但不容忽视的数据分析知识
数据分析是什么,小伙伴们自行去问度娘哈。为了降低阅读压力,不让篇幅太长,我特意拆成上、下两篇来分享自己这几天学到的知识。参考资料我会附在下一篇的末尾,感兴趣的小伙伴可以系统了解下。
我特别不喜欢装逼的产品经理,看文章也一样不喜欢华而不实的。所以督促自己写文章时,把懂的、经历过的能细就写的尽量详细;不懂的就去学,然后把整理的笔记分享出来,数据分析方面我涉入不多,内容由于缺少实战经验,会比较基础和理论,希望同样对你有帮助。
1. 明确数据分析的目的
做数据分析,必须要有一个明确的目的,知道自己为什么要做数据分析,想要达到什么效果。比如:为了评估产品改版后的效果比之前有所提升;或通过数据分析,找到产品迭代的方向等。
明确了数据分析的目的,接下来需要确定应该收集的数据都有哪些。
2. 收集数据的方法
说到收集数据,首先要做好数据埋点。
所谓“埋点”,个人理解就是在正常的功能逻辑中添加统计代码,将自己需要的数据统计出来。
目前主流的数据埋点方式有两种:
第一种:自己研发。开发时加入统计代码,并搭建自己的数据查询系统。
第二种:利用第三方统计工具。
常见的第三方统计工具有:
网站分析工具
Alexa、中国网站排名、网络媒体排名(iwebchoice)、Google Analytics、百度统计
移动应用分析工具
Flurry、Google Analytics、友盟、TalkingData、Crashlytics
不同产品,不同目的,需要的支持数据不同,确定好数据指标后,选择适合自己公司的方式来收集相应数据。
3. 产品的基本数据指标
新增:新用户增加的数量和速度。如:日新增、月新增等。
活跃:多少人正在使用产品。如日活跃(DAU)、月活跃(MAU)等。用户的活跃数越多,越有可能为产品带来价值。
留存率:用户会在多长时间内使用产品。如:次日留存率、周留存率等。
传播:平均每位老用户会带来几位新用户。
流失率:一段时间内流失的用户,占这段时间内活跃用户数的比例。
4. 常见的数据分析法和模型
这里主要科普下漏斗分析法、AARRR分析模型和交叉分析法。
漏斗分析法
用来分析从潜在用户到最终用户这个过程中用户数量的变化趋势,从而寻找到最佳的优化空间,这个方法被普遍用于产品各个关键流程的分析中。
比如,这个例子是分析从用户进入网站到最终购买商品的变化趋势。
从用户进入网站到浏览商品页面,转化率是40%;浏览商品到加入购物车转化率是20%等,那要找出哪个环节的转化率最低,我们需要有对比数据。
比如第一个,进入网站到浏览商品,如果同行业水平的转化率是45%,而我们只有40%,那说明这个过程,没有达到行业平均水平,我们就需要分析具体原因在哪里,再有针对性的去优化和改善。
当然,上面这是我们设计的一种理想化的漏斗模型,数据有可能是经过汇总后得出的。而真实的用户行为往往可能并不是按照这个简单流程来的。此时需要分析用户为什么要经过那么复杂的路径来达到最终目的,思考这中间有没有可以优化的空间。
AARRR模型
这个是所有的产品经理都必须要掌握的一个数据分析模型。
AARRR(Acquisition、Activation、Retention、Revenue、Refer)是硅谷的一个风险投资人戴维 · 麦克鲁尔在2008年时创建的,分别是指获取、激活、留存、收入和推荐。
举个例子,用AARRR模型来衡量一个渠道的好坏。
如果单从数据表面来看,A渠道会更划算,但实际这种结论是有问题的,用AARRR模型具体分析如下:
渠道A的单个留存用户成本是60元,单个付费用户成本是300元;而渠道B的单个留存用户成本是20元,单个付费用户成本是33元,这样对比下来,明显B渠道的优势远远大于A渠道。
5. 常见的数据分析法和模型
在上篇提到的漏斗分析法和AARRR模型外,这里再补充一个:交叉分析法。
交叉分析法:通常是把纵向对比和横向对比综合起来,对数据进行多角度的结合分析。
举个例子:
a. 交叉分析角度:客户端+时间
从这个数据中,可以看出iOS端每个月的用户数在增加,而Android端在降低,总体数据没有增长的主要原因在于Android端数据下降所导致的。
那接下来要分析下为什么Android端二季度新增用户数据在下降呢?一般这个时候,会加入渠道维度。
b. 交叉分析角度:客户端+时间+渠道
从这个数据中可以看出,Android端A预装渠道占比比较高,而且呈现下降趋势,其他渠道的变化并不明显。
因此可以得出结论:Android端在二季度新增用户降低主要是由于A预装渠道降低所导致的。
所以说,交叉分析的主要作用,是从多个角度细分数据,从中发现数据变化的具体原因。
6. 如何验证产品新功能的效果
验证产品新功能的效果需要同时从这几方面入手:
a. 新功能是否受欢迎?
衡量指标:活跃比例。即:使用新功能的活跃用户数/同期活跃用户数。
使用人数的多少还会受该功能外的很多因素影响,千万不可只凭这一指标判断功能好坏,一定要结合下面的其他方面综合评估。
b. 用户是否会重复使用?
衡量指标:重复使用比例。即:第N天回访的继续使用新功能的用户数/第一天使用新功能的用户数。
c. 对流程转化率的优化效果如何?
衡量指标:转化率和完成率。转化率即:走到下一步的用户数/上一步的用户数。完成率即:完成该功能的用户数/走第一步的用户数。
这个过程中,转化率和完成率可以使用(上)篇中提到的漏斗分析法进行分析。
d. 对留存的影响?
衡量指标:留存率。用户在初始时间后第N天的回访比例,即:N日留存率。常用指标有:次日留存率、7日留存率、21日留存率、30日留存率等。
e. 用户怎样使用新功能?
真实用户行为轨迹往往比我们设想的使用路径要复杂的多,如果使用的数据监测平台可以看到相关数据,能引起我们的反思,为什么他们会这么走,有没有更简便的流程,以帮助我们作出优化决策。
7. 如何发现产品改进的关键点
产品改进的关键点,是藏在用户的行为中。
想要找到这些关键点,除了通过用户调研、访谈等切实的洞察用户外,在产品中设置相关数据埋点记录用户的行为,观察其行为轨迹,不能完全替代洞察用户的行为,不过也可以有助于决策产品改进点。
操作步骤:
数据分析这个领域,需要学习的内容,不仅仅只有我写的这些
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
MySQL 服务器内存碎片:成因、检测与内存持续增长的解决策略 在 MySQL 运维中,“内存持续增长” 是常见且隐蔽的性能隐患 —— ...
2025-09-24人工智能重塑工程质量检测:核心应用、技术路径与实践案例 工程质量检测是保障建筑、市政、交通、水利等基础设施安全的 “最后一 ...
2025-09-24CDA 数据分析师:驾驭通用与场景指标,解锁数据驱动的精准路径 在数据驱动业务的实践中,指标是连接数据与决策的核心载体。但并 ...
2025-09-24在数据驱动的业务迭代中,AB 实验系统(负责验证业务优化效果)与业务系统(负责承载用户交互与核心流程)并非独立存在 —— 前 ...
2025-09-23CDA 业务数据分析:6 步闭环,让数据驱动业务落地 在企业数字化转型中,CDA(Certified Data Analyst)数据分析师的核心价值,并 ...
2025-09-23CDA 数据分析师:以指标为钥,解锁数据驱动价值 在数字化转型的浪潮中,“用数据说话” 已成为企业决策的共识。但数据本身是零散 ...
2025-09-23当 “算法” 成为数据科学、人工智能、业务决策领域的高频词时,一种隐形的认知误区正悄然蔓延 —— 有人将分析结果不佳归咎于 ...
2025-09-22在数据分析、金融计算、工程评估等领域,“平均数” 是描述数据集中趋势最常用的工具之一。但多数人提及 “平均数” 时,默认指 ...
2025-09-22CDA 数据分析师:参数估计助力数据决策的核心力量 在数字化浪潮席卷各行各业的当下,数据已成为驱动业务增长、优化运营效率的核 ...
2025-09-22训练与验证损失骤升:机器学习训练中的异常诊断与解决方案 在机器学习模型训练过程中,“损失曲线” 是反映模型学习状态的核心指 ...
2025-09-19解析 DataHub 与 Kafka:数据生态中两类核心工具的差异与协同 在数字化转型加速的今天,企业对数据的需求已从 “存储” 转向 “ ...
2025-09-19CDA 数据分析师:让统计基本概念成为业务决策的底层逻辑 统计基本概念是商业数据分析的 “基础语言”—— 从描述数据分布的 “均 ...
2025-09-19CDA 数据分析师:表结构数据 “获取 - 加工 - 使用” 全流程的赋能者 表结构数据(如数据库表、Excel 表、CSV 文件)是企业数字 ...
2025-09-19SQL Server 中 CONVERT 函数的日期转换:从基础用法到实战优化 在 SQL Server 的数据处理中,日期格式转换是高频需求 —— 无论 ...
2025-09-18MySQL 大表拆分与关联查询效率:打破 “拆分必慢” 的认知误区 在 MySQL 数据库管理中,“大表” 始终是性能优化绕不开的话题。 ...
2025-09-18DSGE 模型中的 Et:理性预期算子的内涵、作用与应用解析 动态随机一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明确:TIF 中的地名有哪两种存在形式? 在开始提取前,需先判断 TIF 文件的类型 —— ...
2025-09-17CDA 数据分析师:解锁表结构数据特征价值的专业核心 表结构数据(以 “行 - 列” 规范存储的结构化数据,如数据库表、Excel 表、 ...
2025-09-17Excel 导入数据含缺失值?详解 dropna 函数的功能与实战应用 在用 Python(如 pandas 库)处理 Excel 数据时,“缺失值” 是高频 ...
2025-09-16深入解析卡方检验与 t 检验:差异、适用场景与实践应用 在数据分析与统计学领域,假设检验是验证研究假设、判断数据差异是否 “ ...
2025-09-16