京公网安备 11010802034615号
经营许可证编号:京B2-20210330
如何做好数据异常分析
对于用户端产品经理来说,监控处理日常的用户端数据是必不可少的工作之一,转化数据、用户数据、交易数据等等,都应该是列入日常监控的数据指标。一般来说,这些数据都有固定的波动周期,每个周期内的数据变化应该是趋于稳定的,如果某天某周某月的数据不再符合预期的稳定变化,也就是我们所说的数据异常。这种情况下,我们需要去深挖数据异常产生的原因。虽然这种分析有点时候诸葛亮的意味,而且分析的过程往往无趣且极其耗费时间,对于那些认为产品经理的工作理应充满挑战和创新的人来说,这项工作简直是最让人厌恶的了。
但是数据异常的分析仍然是必要的,首先,对于产品的各种数据知其所以然,这是对产品经理的基本要求;其次通过数据异常分析往往能够发掘未知的机会或风险,尤其难得的是这些机会和风险往往是我们平时忽略的(要不然我们也不会认为是“异常”),这对产品的持续优化具有重要意义。(虽然我明白其中的道理,不过说实话数据异常分析仍然是我最讨厌的工作,没有之一%>_<%)
那么如何才能做好数据异常分析呢?(或者换个说法:如何完成我们必须要做的烦人分析工作?)首先,当然是要求我们能识别和确认数据异常,其次就是细致的分析过程,如果想要很好的完成这个过程,我认为可以用八个字概括:大胆设想,小心求证。
既然是数据异常分析,那么我们必须能察觉到这些异常,然后还要确认数据异常是真的存在,否则只会在错误的道路上越走越远。察觉数据异常最难也最简单,最难是因为察觉的过程往往依靠丰富的经验和对产品和业务的充分了解,我们称之为产品经理的数据敏感。最简单是因为我们一旦有了这种敏感性,只要借助基本的数据报表,就能够风吹草动无微不察。数据敏感不是一个“硬”技能,也很难说有具体的操作步骤去提高数据敏感性,这种敏感一部分真的要靠天赋,有些人可能逻辑性强,通过数据本身的相对关系就能够发现异常的存在,比如DAU和转化率都有提升而交易额呈下降趋势(这个异常相对明显,原谅我一时举不出需要更严密逻辑分析的例子)。另一部分,它需要产品经理对产品和业务有足够的了解,这个是可以通过平时多加关注各种产品数据来逐渐加强的,比如养成仔细阅读产品数据报告的习惯,然后对一些无法理解的数据进行详细分析,经过长期的主动训练,是一定可以提高数据敏感度的,这也是为什么Leader们(有经验的产品经理)更容易发现异常的原因。
如果你已经具备了察觉或明显或隐蔽的数据异常的能力,你或许有发现宝藏的兴奋,迫不及待的想要去搞清楚所以然。但是我建议你在行动前最好确认一下这个异常是真的存在,简单的说,就是确认下数据有没有问题。这种事情很常见:我们经常会遇到数据服务、数据上报、数据统计上的BUG,然后数据报表中的数据就变得难以理解。所以,找数据报表的产品和技术同事确认一下是不是真的异常吧。
如果数据异常经确认确实存在,那么你就要去找原因了。这个找原因的过程总结起来就是前面所说的“大胆设想,小心求证”,大胆设想就是对异常产生的原因做出合理的猜测,因为异常之所以为异常,是因为我们之前的忽视,所以在猜测的过程中需要脑洞大开,联系所有你能够想到的所有可能,回顾所有产品相关的信息,然后猜测一个可能造成数据异常的原因。小心求证是说在做出猜测之后,我们需要对自己的猜测负责,找到能够支持(或者否定)这种猜测的数据。
那么,我们如何才能做到脑洞大开大胆设想呢?对新手产品经理(好吧,数据异常分析好像大多由新手来分析处理)来说,你可能会觉得两眼一抹黑不知如何下手,下面有一个简单的表格,可供参考。
* 如果你看到这个表格已经知道我要说些什么,那后面的内容你可以不用看了。
对于大部分已经产生的数据异常,大概可以从两个维度来分类(个人经验总结,可能不同产品有不同的分类方式,但是我坚持推荐这种通过分类来确定分析方向的方式):
我将已经遇到过的情况和一些觉得可能以后会遇到的情况填充到这个表格中,通过这些例子对这种分析(猜测)方法做出解释。
产品层面,A1和B1两种情况是指当自身的产品或者竞对的产品因为功能变更造成的数据变化,比如自己产品因为增加了高价排序功能造成客单价升高,而竞对将某些品类商品入口提前而造成自己App上这类商品的交易额降低;C1指大环境发生了变化,而造成自己的产品数据变化,比如我们可以猜想当微博兴起时,人人网的产品经理会发现DAU持续下降。
因为大多数产品经理并非技术出身,所以技术上的问题往往是产品经理在分析数据时忽视的内容。比如A2,当我们的列表展示接口不够稳定时,会造成列表页点击率降低,进而交易额等等都接连降低。比如B2,当2015.5.28,携程因为系统故障而无法访问时,其他OTA网站的交易量可预见是提升的。C2情况相对少见,比如2014.1.21,国内所有通用顶级域的根服务器出现异常,而当日国内大部分网站的数据毫无疑问应该是异常的。
用户层面,当用户整体特征逐渐变化时,产品数据也会逐渐变化。对于A3和B3情况,我们假设有一类产品,最初培养的一群用户是学生,消费能力有限。如果这个产品黏性够强,当这批学生逐渐步入社会,客单价可能会持续增长。C3情况,每年到11月,各OTA网站的DAU和交易额整体就会降低,而三亚地区的交易额逆势上升,这就是大环境下旅游淡旺季的原因造成的。
对于需要支付的产品来说,所有运营活动都能影响市场的大小以及市场份额的分布,比如滴滴和快的在培育市场阶段,任何一方的大额促销都会提升自己的市场份额并侵占竞对的市场份额(A4和B4),而当滴滴快滴合并之后红包额度的减少,必然会造成App叫车用户数量的降低(C4)。
前面讲了大胆设想的方法,如果只是停留个这个层面,那这个分析是没有说服力的,下面还有一个重要的步骤是小心求证。小心求证是找到直接或间接的证据来证明你的猜想。对于大环境维度的数据异常原因猜测,一般可以获取一些能够反映大市场的数据来证明,比如OTA网站DAU在某月降低幅度很大,我们猜测是因为旅游淡季开始,这时候可以去百度指数看看“酒店”或“酒店预订”搜索热度的变化,或者查查往年此时的旅游消费数据,就可以验证我们的猜测是否准确。
而对于自身产品和竞对产品维度的求证,不二法宝就是细分,下面介绍一些常见的细分维度及其案例。
关于如何做细分分析,这里没有办法穷举,可以细分分析的维度实在太多了,但是我们需要记住这种分析方式,当猜测是某种原因造成数据异常时,只要找到该原因所代表的细分对立面做对比,就可以证明或证伪我们的猜测。当然,在分析的过程中,我们需要了解一些基本的统计学知识,这个将会在下周的推送中详细介绍,敬请期待。
当发现数据异常时或者接到数据异常分析任务时,我们可以联系产品相关的信息,在范围维度(自身、竞对、大环境)和内容维度(产品、技术、用户、运营)结合给出合理的猜测,然后通过查看一些大环境变化数据或者细分的产品数据来验证我们的猜测。遵照这个流程,一般能够找到数据异常的深层原因,当然,着需要花费大量的时间和足够的耐心,但它能够让我们更深更全面的了解自己负责的产品的相关信息,并为未来的产品决策提供指导。对我们自己,这也能加强数据敏感度,让我们能够发现更多机会和问题,形成一个良性循环,成为一个能玩转数据的产品经理。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据清洗、统计分析与数据质量检测工作中,箱型图(又称箱线图、Box Plot)是最直观、最高效的可视化分析工具之一。相较于柱状 ...
2026-05-25在大数据分析、数据清洗、质量管控、风险监测等领域,异常数据识别是保障数据质量、确保分析结论精准、规避业务决策失误的核心基 ...
2026-05-25 很多数据分析师精通Excel函数和透视表,但当被问到“数据从哪里来”“表和视图有什么区别”“数据库管理系统和SQL是什么关系 ...
2026-05-25数字化经营时代,企业的市场竞争早已从经验决策转向数据决策。门店营收、用户转化、产品销量、成本损耗、存量资产等所有经营行为 ...
2026-05-22在MySQL数据库日常运维、业务数据校验、数据迁移与数据清洗场景中,自增主键ID的连续性校验是一项基础且关键的工作。MySQL的Auto ...
2026-05-22 很多企业团队并非缺乏指标,而是陷入“指标失控”:仪表盘上堆满实时跳动的数据,却无法回答“当前瓶颈在哪、下一步该做什么 ...
2026-05-22【核心关键词】大数据、可视化、存储、架构、客户、离线、产品、同步、实时、数据仓库、数据分析、数据可视化、存储数据、离线 ...
2026-05-21在电商流量红利消退、公域获客成本持续走高的当下,存量用户深度挖掘已成为店铺增收增效的核心抓手。相较于付费投放获取的陌生新 ...
2026-05-21 很多数据分析师每天盯着几十个指标,但当被问到“这套指标要支撑什么业务目标”“指标之间是什么逻辑关系”“业务变化时如何 ...
2026-05-21在数据驱动决策的时代,数据质量直接决定分析结果的可靠性与准确性,而异常值作为数据清洗中的核心痛点,往往会扭曲分析结论、误 ...
2026-05-20 很多数据分析师每天盯着GMV、DAU、转化率,但当被问到“哪些指标在所有行业都适用”“哪些指标只对电商有意义”“二者如何搭 ...
2026-05-20Agent的能力边界,很大程度上取决于其掌握的Skill质量和数量。传统做法是靠人工编写和维护Skill,但这条路很快会遇到瓶颈。业务 ...
2026-05-20在统计分析中,方差分析(ANOVA)是一种常用的假设检验方法,核心用于分析“一个或多个自变量对单个因变量的影响”,广泛应用于 ...
2026-05-19 很多数据分析师每天盯着GMV、DAU、转化率,但当被问到“什么是指标”“指标和维度有什么区别”“如何定义指标值的计算规则和 ...
2026-05-19想高效备考 CDA 一级,拒绝盲目刷题、冗余学习?《CDA 一级教材知识手册》重磅来袭!以官方教材为核心,浓缩 13 章 103 个核心考 ...
2026-05-19在数据统计分析中,卡方检验是一种常用的非参数检验方法,核心用于判断两个或多个分类变量之间是否存在显著关联,广泛应用于市场 ...
2026-05-18在企业数字化转型的浪潮中,很多企业陷入了“技术堆砌”的误区——上线了ERP、CRM、BI等各类系统,积累了海量数据,却依然面临“ ...
2026-05-18小陈是某电商平台的数据分析师。老板交给他一个任务:“我们平台的注册用户已经突破1000万了,想了解一下用户的平均月消费金额。 ...
2026-05-18【专访摘要】本次CDA持证专访邀请到拥有丰富物流供应链数据分析经验的赖尧,他结合自身在京东、华莱士、兰格赛等企业的从业经历 ...
2026-05-15在数字化时代,企业的每一次业务优化、每一项技术迭代,都需要回答一个核心问题:这个动作到底能带来多少价值?是提升了用户转化 ...
2026-05-15