京公网安备 11010802034615号
经营许可证编号:京B2-20210330
数据分析:产品经理的数据能力
继竞品分析之后,“数据能力”也是产品经理的重要基本能力之一。这里总结下产品经理使用数据的姿势和方法。
写在开篇的声明
1)这里写的是产品经理(不是数据建模工程师)工作中所需的数据分析能力,因此并不涉及复杂的数理统计和数据挖掘知识。
2)用户画像和市场数据也是数据的一部分,但个人习惯将其归为用户和市场研究部分。后续用户和市场分析会详细展开。
3)不要强求数据的绝对准确,而要追求数据的相对准确。所以如果感觉数据有问题,不要在没有论证的情况下冲到工程师面前质疑一番,一是没有确定问题存在的时候很难查证,二是会让工程师反感。
产品数据的作用
监控产品设计、运营效果、营收是否正常或达标。
判断业务发展阶段,为后续推进提供参考。
数据能力的核心
数据打点
数据使用
数据预估
一、数据打点
打点也叫埋点,其原理就像在路上安放监控探头,一旦有符合记录条件的车通过,探头就会按照设定上报相关信息。
步骤一:在打点前先弄清楚是客户端打点还是前端打点。
客户端打点要尽可能全面并具有扩展性。因为客户端只有升级才会更新新的打点代码。并且还有升级覆盖率问题。所以一定要把数据框架打好,否则后续进行数据分析会非常困难。
如果是前端打点就方便很多。根据需求随时调整,随时上线,而且用户刷新一次页面代码就能被升级上来。不过经常变动也会让工程师重复工作,影响工程师情绪。
步骤二:提供打点需求,就是明确在什么情况下要什么数据,最终为什么分析做准备。务必弄清指标的确切定义。
比如,次日留存,30日留存,月留存,新用户次日留存,都是什么意思,有什么区别。
问题:产品经理应如何提供打点需求?尤其是当产品经手一个不熟悉的项目时。
个人习惯先跟相关同事沟通,然后穷举,之后筛选出核心指标,重要指标,次要指标,检测指标。有条件的话可以再请资深人士评估下。虽然耗时,但稳妥。
穷举的过程从每个入口和页面逐一列举开始:比如对一个手机软件,起点应该从应用商店下载开始,终点是用户卸载。然后是每个地方的入口pv,uv,按钮点击及对应uv,内容曝光及对应点击、对应uv,时长及对应uv,输入内容及对应uv,以及特殊信息如购物类的客单价等。
并且可以按照新老用户,或者分级用户,按渠道切分对比。预留好各个渠道ref接口。如果有AB试验,则需要支持试验对比。
释义:
核心指标:一般包括DAU、MAU、平均时长、人均启动、日新增、关键转化(比如订单转化、阅读转化)日卸载。新老用户留存(日周月)。如果有内容则会增加曝光量,曝光点击,曝光点击率,人均曝光等(ps:KPI相关指标都应该列为核心指标 )
重要指标:一般是核心操作,重要内容,关键路径的相关打点数据。流量分布,漏斗或者也叫流失模型。如视频播放vv,客单价,搜索量等等。
检测指标:一般就是错误提示或者性能参数,失败反馈等信息上报。能有效反馈设计质量和工程质量。
其他指标:可以归结为次要指标,一般是辅助性或验证性。或者某些功能上线之初效果评估。
注意事项:
2、打点数据最好能带着用户参数,渠道参数,入口参数,从而能有效追述用户路径,评估渠道,评估入口,分析新老对比等。
表中关于曝光的统计就是需要特殊说明的,产品经理不能简单的四个字“统计曝光”就提给工程师,如果有特殊需求要标注清楚给工程师。
二、数据使用(呈现/分析/汇报)
后台呈现:数据呈现是为了方便快捷直观的观察数据情况,分为表格和图表两种形式。表格需要支持导出,从而方便深入计算。图表最常用的就是折线图(看趋势),柱状图(看关系),饼图(看比例)。
过于复杂的后台呈现会导致过多工程资源消耗,因此建议初期以基本数据能正常呈现和导出为标准即可。初期通过手动分析数据走势和之间的逻辑关系,经过人工的分析充分掌握数据规律,然后再优化后台呈现,这样更方便高效,并且在项目初期数据变化较大随时可能面临调整。
同时关于筛选条件一定要制定好,并能方便的多维度进行对比。如:按新老用户,按渠道,按版本,按入口,按时间粒度。
当然对于已经成熟的项目和呈现后台则另当别论。(miui有很多数据分析后台,防止泄密这里就不上示例参考了)
数据分析:首先要具备一定的数理统计知识。这个必修课了。比如如何区分平均数和中位数的作用?什么情况下看平均,什么情况下看中位数。
个人看过的统计相关书单:《爱上统计学》尼尔.J.萨尔金德 重庆大学出版社《统计学原理》 张瞳光等 中国商务出版社《统计学导论》 李 勇等 人民邮电出版社《应用统计学》 朱建平等 清华大学出版社《数据挖掘概念与技术》 韩家炜等 机械工业出版社(最后一个可以不看)
其次熟练掌握excel。比如是否能够使用分列、分级、透视等几个功能。(筛选,排序等功能太小儿科了)比如是否能够使用IF、COUNTIF等公式(SUM太小儿科了)再进阶的话就是使用VB语言进行分析。个人学习excel经验是在实践中摸索,对于这种基础软件没有必要专门买教程学习,每次根据需求百度,然后做好笔记即可。本人也用过spss,不过产品经理精通excel足够了。
最后数据分析工作重点:
1、日常监控相关数据的变化和波动,并总结规律,比如对于时钟应用可以看到每周会呈现相对规律的变动。对于出现异常波动的数据要及时跟进。实操举例:
图中圆圈处数据,断崖式,断崖时间1天,很有可能是数据统计变更或后端or前端打点出现问题。图中方框处数据,呈现明显周期性规律,并且微微上扬。能够直观体现用户使用行为和高峰,从而确定产品优化点和关键运营时间。微微上扬则能表现出入口流量增长或流失减少,又或者留存提高。
2、关键漏斗模型的建立和监测。对于流失率较高的环节及时跟进和优化。
3、对于功能改进,运营效果,商业变动的数据总结和分析,有问题需及时进行调整。
数据汇报:数据汇报太偏重技术表现不展开说明,核心重点:区分不同的汇报场景选取关键数据,针对有效数据选择恰当的表现方式即可。说明问题即可,不用面面俱到使得汇报冗余
三、数据预估(最重要的数据能力)
相对于数据打点和数据使用,数据预估是更重要的能力,其需要建立在丰富的数据经验和统计知识的基础之上,也是产品经理对自己项目把控力的重要体现。
当一个产品能够相对准确的预估项目数据变化及相关优化后的数据波动,就能够有效的根据项目情况和资源情况安排产品重点和进度。做到进退有度。
如假设产品经理要将产品日活从年初100w年底提升至500w。首先要能够准确预估期间有哪些手段能影响用户量提升,各自提升效果有多少,资源投入有多少,见效周期是多少。从而安排工作重心和节奏。这个时候对数据预估的准确性则会直接影响产品的发展速度。
对于高级产品或者背负KPI的产品,必须具备数据预估能力。从而合理安排工作计划,带领团队有效的推动项目发展。
这里总结下个人经验,首先要拆解某项数据指标,比如营收数据,要根据项目的营收结构逐项拆解,其次了解每一项的波动规律。如某些同活跃用户波动相关、某些同时间或节日波动相关、某些同大盘数据波动相关。同时要了解历史上相关波动幅度。以及用户潜力,比如浏览器搜索用户占比可以提升到40%以上。
如果有工程资源,最好能针对某些重要的改进提前进行抽样测试,从而推断全局后的数据变化情况。比如我们建立起版本灰度机制,一方面更好的发现bug,另一方面能及时评估版本全量后的数据变化,从而判断是否对当前版本进行全量。(ps 这个地方的工作成果太过涉密,就不上示例了。)
写在结尾的注意事项
数据不代表一切,不能盲目相信数据,但更不能不看数据、不懂数据。
不要强求数据的绝对准确,而要追求数据的相对准确。
不要感觉数据有问题就冲到工程师面前,要切实分析出问题。秉持谁提议谁举证的原则。
一定要弄清楚指标的定义,不能似是而非。
数据分析是一个严谨的逻辑过程,要保证推断的客观性,不能为了证明而证明。
数据分析是随着产品发展而不断细化和迭代的,不要在开始阶段就投入大量资源进行数据分析。
写在最后
随着项目的日益发展,数据分析也会更加精细和复杂,因此慢慢的出现了数据产品经理,对于数据产品经理还是应该学些基础的Python、SQL、VBA技能。
这里说些题外话,数据是简单、直接的,也是饱受争议的。但当真正看到庞大的数据所表现出的特征后,你会震撼于从未感知过的世界的另一面。无论如何必须要感激当前的科技进步能够让我们有机会直面数以亿计的人产生的成百上千亿的行为。就像一粒水终于可以看到整个大洋的流动,就像上帝打开一扇窗让我们从他的角度俯视大地。
你会真正纠结于是否要为满足几千万人的需求放弃其他几十万人。这不再是课本上的哲学命题。
你会兴奋于几千万人按照你的设定向预期的结果发展。这有一种替上帝做决定的成就感。
你会深思低俗文章的点击率难以让正规文章望其项背。必须一遍遍权衡其中的利弊做出让步。
最后再说一点互联网圈外人特别关心的数据隐私的事情,拥有这些大数据的公司不会八卦你到底是谁干过啥。它们只关心人群的趋势和方向,从而怎么更好的服务用户产生价值。
只有政府、变态和骗子才会关心和利用你个人的信息。而且骗子会通过各种渠道手段获取你的信息,所以对待自己身份信息和财务密码信息一定要谨慎,谨防上当受骗。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据分析中,“正态分布” 是许多统计方法(如 t 检验、方差分析、线性回归)的核心假设 —— 数据符合正态分布时,统计检验的 ...
2025-10-28箱线图(Box Plot)作为展示数据分布的核心统计图表,能直观呈现数据的中位数、四分位数、离散程度与异常值,是质量控制、实验分 ...
2025-10-28在 CDA(Certified Data Analyst)数据分析师的工作中,“分类变量关联分析” 是高频需求 —— 例如 “用户性别是否影响支付方式 ...
2025-10-28在数据可视化领域,单一图表往往难以承载多维度信息 —— 力导向图擅长展现节点间的关联结构与空间分布,却无法直观呈现 “流量 ...
2025-10-27这个问题问到了 Tableau 中两个核心行级函数的经典组合,理解它能帮你快速实现 “相对位置占比” 的分析需求。“index ()/size ( ...
2025-10-27对 CDA(Certified Data Analyst)数据分析师而言,“假设检验” 绝非 “套用统计公式的机械操作”,而是 “将模糊的业务猜想转 ...
2025-10-27在数字化运营中,“凭感觉做决策” 早已成为过去式 —— 运营指标作为业务增长的 “晴雨表” 与 “导航仪”,直接决定了运营动作 ...
2025-10-24在卷积神经网络(CNN)的训练中,“卷积层(Conv)后是否添加归一化(如 BN、LN)和激活函数(如 ReLU、GELU)” 是每个开发者都 ...
2025-10-24在数据决策链条中,“统计分析” 是挖掘数据规律的核心,“可视化” 是呈现规律的桥梁 ——CDA(Certified Data Analyst)数据分 ...
2025-10-24在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23在数据分析全流程中,“数据清洗” 恰似烹饪前的食材处理:若食材(数据)腐烂变质、混杂异物(脏数据),即便拥有精湛的烹饪技 ...
2025-10-23在人工智能领域,“大模型” 已成为近年来的热点标签:从参数超 1750 亿的 GPT-3,到万亿级参数的 PaLM,再到多模态大模型 GPT-4 ...
2025-10-22在 MySQL 数据库的日常运维与开发中,“更新数据是否会影响读数据” 是一个高频疑问。这个问题的答案并非简单的 “是” 或 “否 ...
2025-10-22在企业数据分析中,“数据孤岛” 是制约分析深度的核心瓶颈 —— 用户数据散落在注册系统、APP 日志、客服记录中,订单数据分散 ...
2025-10-22在神经网络设计中,“隐藏层个数” 是决定模型能力的关键参数 —— 太少会导致 “欠拟合”(模型无法捕捉复杂数据规律,如用单隐 ...
2025-10-21在特征工程流程中,“单变量筛选” 是承上启下的关键步骤 —— 它通过分析单个特征与目标变量的关联强度,剔除无意义、冗余的特 ...
2025-10-21在数据分析全流程中,“数据读取” 常被误解为 “简单的文件打开”—— 双击 Excel、执行基础 SQL 查询即可完成。但对 CDA(Cert ...
2025-10-21在实际业务数据分析中,我们遇到的大多数数据并非理想的正态分布 —— 电商平台的用户消费金额(少数用户单次消费上万元,多数集 ...
2025-10-20在数字化交互中,用户的每一次操作 —— 从电商平台的 “浏览商品→加入购物车→查看评价→放弃下单”,到内容 APP 的 “点击短 ...
2025-10-20