
8分钟让你快速读懂数据分析
最近在学习一些数据分析方法,结合自己的一些心得,梳理出以下数据分析文章,读完本文大概需要8-10分钟。
一、什么是数据分析?
数据分析是指用适当的统计方法对收集来的数据进行分析,以求最大化的发挥数据的价值。数据如同金钱一样,本身并没有太多的价值,而正是由于使用分析方法的存在,利用分析方法来得出一定的结论与发现问题,从而挖掘其巨大的价值。
二、为什么数据分析?
很多时候,VC投资需要看数据,做投资决策;公司产品/运营需要做迭代的依据... 数据需求的可能会来自多个方面,总体而言,数据分析的原因主要有以下四种:
1.驱动产品迭代:
用户使用产品的真实轨迹是怎样的?为什么他们会这么做,有没有更简便的流程,以帮助我们作出优化决策?也可以分析产品过往的数据,来洞悉问题,驱动有目标的产品迭代。
2.深度需求分析
对用户所处马斯诺几个层面的需求,用数据来支撑;对交互需求,用数据佐证;对公司层面的需求,通过数据验证合理性。
3.驱动运营决策:
产品新功能上线后效果怎么样?新功能的用户活跃度、用户留存率的变化?A方案和B方案哪个更好?诸如此类的问题,评判一个问题的好坏,比较可靠的恐怕就是数据了。感性的定义很多时候往往会产生大量的不必要的争执。
4.决策商业机会:
针对商业机会的评估,必要的需求调研及市场调研显得尤为关键。一个新市场是否值得介入?一个新项目是否值得投资?是否可以收购某公司等等?
三、如何数据分析?
1、数据采集:
原则1:全量而非抽样
采集多种数据来源,前端与后端、业务数据库的全面采集。前端有网页端与APP客户端等,后端采集用来补充前端行为事件所无法采集到的数据。
原则2:多维细分
针对客户行为事件实现5W1H的全面细化,将行为中的什么人、什么时候、从哪里、什么原因、什么事情、如何做的行为轨迹全面记录下来,并进行细化,人(who)可以从注册账号、性别、年龄、个人成长阶段等细分;时间(when)可以从起始时间、结束时间等细分;从哪里(where)可以从IP、位置信息、运营商、OS、机型、IMEI、网络接入方式(2G/3G/4G/WIFI)等细分;原因(why)可以从爱好、需求层级等细分;事情(what)可以从主题、步骤等细分。行为事件与维度的结合,就能得出需要的指标,比如用户在什么地域下的订单......
目前数据采集(埋点)方式主要有三种:
第一种:使用第三方统计分析标准SDK接入到应用中
第二种:使用无埋点方式
第三种:自己开发,精细化运营与产品决策
2、数据建模:
搭建数据指标模型大致要考虑以下三大要素:
a.打通行为数据与业务数据;
b.回归关键数据指标
c.多维度考虑数据可行性
第一关键指标方法
找出第一关键重要指标,然后衍生于子指标,比如:电商销售额
如果你想提升销售额,要么提升买家数,要么提升客单价。
销售额=买家数x客单价
销售额=流量x转化率x客单价
在到达商品详情页中,这个还可以衍生为:
销售量=商详uv x 下单率 x 付款率x客单价
销售量= 活动展现 x 活动转化率x 下单率x付款率x客单价
各阶段指标侧重:
MVP阶段(验证):验证可行性与以用户留存率为目标,定性分析,这个阶段本身并没有多少数据可言(数据型产品)除外。
增长阶段(跨越鸿沟):大多数公司都没能到这个阶段,增长阶段的数据分析需要适当的去对应相应的数据产品分析师,或者使用更深度的数据工具来做相应的决策。可以分为两个层面
1.留存阶段,主要以留存率为指标(次日留存、7日留存、15日留存、30日留存率等);
2.引荐阶段,主要考虑病毒系数与病毒周期:平均一个用户能带来多少个新用户。所以当病毒系数大于1时,信息将会不断扩散,而总传播人数是发散的。相反,当病毒系数小于1时,总传播人数是收敛的,以及NPS(净推荐值)。
平台期(激活转化):有专门的数据分析师、工程师,团队对数据分析更加深入。主要关注的是平台用户的活跃度、转化率,使得度过平台期迎来下一个增长期。
变现期:营收成本、用户激活召回、LTV、CAC、渠道分析等指标
3、数据分析:
分析方法:有效的数据分析方法能够深度挖掘数据的价值,常见的数据分析法与模型有用户分群、A/B测试、多维事件分析、漏斗分析、AARRR分析等等
这里主要以漏斗分析法、AARRR分析模型、A/B测试、多维事件分析为例展开:
● 漏斗分析法
分析从潜在用户到最终转化用户这个过程中用户数量的变化趋势,从而寻找到最佳的优化空间,这个方法被普遍用于产品运营的各个关键流程分析中。
何为用户转化漏斗,就是你的业务是如何一步步将一个用户转化过来。比如:
活动:活动展示—>点击详情—>转化
约妹子:搭讪—>约会—>牵手->......
经过的每个阶段,都可以拆为好几个子阶段。而每一个阶段都会有用户流失、用户留存下来。对漏斗的每一个环节准确地记录数据,以便分析和优化各个环节的转化率,是数据化运营的基础设施。
比如一个电商的活动页,它的漏斗模型应该是这样的:
从浏览活动页面到详情页的转化率是50%,在详情页下单的下单率是10%,最终下单到付款的转化率是40%。
有这么个漏斗,我们就可以分析每个环节代表了什么,该如何去改善:
活动页—>详情页uv:页面上的内容是否醒目,商品是否是用户喜欢的,需根据页面点击情况及时替换点击效果差的商品。
详情页uv—>下单人数:详情页是否吸引人,页面加载速度是否有影响,是否需要将商品重新排序。
下单人数—>付款人数:是否支付引导差,支付工具是否有故障,是否低于业内平均指标。
另外,在同一个系统内部,也需要做转化率进行对比,比如本月与上月,本周与上周,增加了还是减少了,这样才能得出更为准确的结论与发现问题。
● AARRR模型
AARRR(Acquisition、Activation、Retention、Revenue、Refer)是硅谷的一个风险投资人戴维 · 麦克鲁尔在2008年时创建的,分别是指获取、激活、留存、收入和推荐。
以下例子中渠道A与渠道B哪一个更优?
比如游戏AARRR各阶段指标
1.A(How do users find us?)
DNU(日新注册且登陆用户数)、推广渠道监测(成本、流量)
2.A(Do users have a great first experience?)
DAU(每日登陆过游戏用户数)、日均使用时长、道具关联分析模型
3.R(Do users come back?)
留存率(次日留存、7日留存、21日留存、30留存)、流失率、流失预警分析模型
4.R(How do you make money?)
PR(付费率)、 ARPU(平均每用户收入)、ARPPU(平均每付费用户收入))、LTV(生命周期价值)
5.R(Do users tell others?)
K-factor、NPS等
● A/B测试
A/B测试就是通过数据支撑,不同渠道、不同人群、最终选定方案。
A/B测试需要有一定的数据支撑,建立准确性与效率高的框架,比如针对不同渠道、用户分群发布、灰度发布等来得出合适方案,这里不加以展开.
● 多维事件分析法
多维事件分析,从多个角度细分数据,从中发现数据变化的具体原因。行为事件与维度的结合可以得到数据指标,比如在电商应用中:
行为事件(1H):搜索商品、点击商品详情、提交订单、支付订单、售后服务等等都是一系列事件
维度(5W):人(who)可以从姓名、性别、年龄;时间(when)可以从停留时间、下单事件、付款事件、到货时间等细分;从哪里(where)可以从IP、城市、运营商、OS、机型、IMEI、网络接入方式(2G/3G/4G/WIFI)等细分;原因(why)可原因(why)可以从爱好、需求层级等细分;事情(what)可以从主题、步骤等细分。
两者结合就可以得出多维度指标,比如用户在哪个区域下订单,从什么渠道过来的,过去一段事件支付订单款项多少等等......
数据虽然不可或缺,但也不是万能的,比如在产品创新方向上很难获得驱动,在长期的用户反馈上很难获得数据的足够判断,那么真正能驱动一款产品的用户快速增长,靠的都是什么方法呢?
- 做真正有意义的产品
市场上很大一部分产品都是意义不大的,尤其在这个存量过于饱和的市场下,要获得用户的快速增长,还是应该回到产品的核心上来,创造真正有价值的东西,辅以数据驱动,这样的结合可能能获得更大的增长。
- 塑造品牌价值
对核心用户尤其要重点塑造品牌观念,在传统行业中,众多企业做品牌的重视度高于互联网行业的企业,而在互联网确是常常不被重视的,与本身的燥热有很大关系,也许我们可以看看健身应用Keep的slogan与品牌塑造案例里面学习到更多的东西。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
机器学习解决实际问题的核心关键:从业务到落地的全流程解析 在人工智能技术落地的浪潮中,机器学习作为核心工具,已广泛应用于 ...
2025-09-09SPSS 编码状态区域中 Unicode 的功能与价值解析 在 SPSS(Statistical Product and Service Solutions,统计产品与服务解决方案 ...
2025-09-09CDA 数据分析师:驾驭商业数据分析流程的核心力量 在商业决策从 “经验驱动” 向 “数据驱动” 转型的过程中,商业数据分析总体 ...
2025-09-09R 语言:数据科学与科研领域的核心工具及优势解析 一、引言 在数据驱动决策的时代,无论是科研人员验证实验假设(如前文中的 T ...
2025-09-08T 检验在假设检验中的应用与实践 一、引言 在科研数据分析、医学实验验证、经济指标对比等领域,常常需要判断 “样本间的差异是 ...
2025-09-08在商业竞争日益激烈的当下,“用数据说话” 已从企业的 “加分项” 变为 “生存必需”。然而,零散的数据分析无法持续为业务赋能 ...
2025-09-08随机森林算法的核心特点:原理、优势与应用解析 在机器学习领域,随机森林(Random Forest)作为集成学习(Ensemble Learning) ...
2025-09-05Excel 区域名定义:从基础到进阶的高效应用指南 在 Excel 数据处理中,频繁引用单元格区域(如A2:A100、B3:D20)不仅容易出错, ...
2025-09-05CDA 数据分析师:以六大分析方法构建数据驱动业务的核心能力 在数据驱动决策成为企业共识的当下,CDA(Certified Data Analyst) ...
2025-09-05SQL 日期截取:从基础方法到业务实战的全维度解析 在数据处理与业务分析中,日期数据是连接 “业务行为” 与 “时间维度” 的核 ...
2025-09-04在卷积神经网络(CNN)的发展历程中,解决 “梯度消失”“特征复用不足”“模型参数冗余” 一直是核心命题。2017 年提出的密集连 ...
2025-09-04CDA 数据分析师:驾驭数据范式,释放数据价值 在数字化转型浪潮席卷全球的当下,数据已成为企业核心生产要素。而 CDA(Certified ...
2025-09-04K-Means 聚类:无监督学习中数据分群的核心算法 在数据分析领域,当我们面对海量无标签数据(如用户行为记录、商品属性数据、图 ...
2025-09-03特征值、特征向量与主成分:数据降维背后的线性代数逻辑 在机器学习、数据分析与信号处理领域,“降维” 是破解高维数据复杂性的 ...
2025-09-03CDA 数据分析师与数据分析:解锁数据价值的关键 在数字经济高速发展的今天,数据已成为企业核心资产与社会发展的重要驱动力。无 ...
2025-09-03解析 loss.backward ():深度学习中梯度汇总与同步的自动触发核心 在深度学习模型训练流程中,loss.backward()是连接 “前向计算 ...
2025-09-02要解答 “画 K-S 图时横轴是等距还是等频” 的问题,需先明确 K-S 图的核心用途(检验样本分布与理论分布的一致性),再结合横轴 ...
2025-09-02CDA 数据分析师:助力企业破解数据需求与数据分析需求难题 在数字化浪潮席卷全球的当下,数据已成为企业核心战略资产。无论是市 ...
2025-09-02Power BI 度量值实战:基于每月收入与税金占比计算累计税金分摊金额 在企业财务分析中,税金分摊是成本核算与利润统计的核心环节 ...
2025-09-01巧用 ALTER TABLE rent ADD INDEX:租房系统数据库性能优化实践 在租房管理系统中,rent表是核心业务表之一,通常存储租赁订单信 ...
2025-09-01