
用数据管理“用户生命周期”
腾讯的精细化运营是如何贯穿于整个产品过程中的?
腾讯用到一个很重要的方法,即用户生命周期管理办法。这也是社交网络事业群正在力推的一个很重要的方法论。
什么叫用户生命周期管理?传统营销学讲的是客户生命周期管理,因为腾讯社交群主要客户就是用户,所以我们叫用户生命周期管理。但是传统的对应的理论是客户生命周期管理,简称CLM。《王永庆传》提到一个一个米店老板怎么做生意,他每天会收集顾客用米的情况,包括家里有多少成员,然后能估计到他每天吃多少米,然后推算出这个家庭什么时候能把米吃完。比如买10公斤大米,估计是半个月,到快吃完时,他就会主动送货上门,或者主动打电话。他用这种办法赢得了客户。很快他的经营网络就超过了其他店。
再比如一个游戏数据图表,横轴是游戏用户使用时长,纵轴是活跃用户量。第20轴到25轴用户分两波,有60%的用户活跃用户量下滑得比较明显,还有一波用户是相对保持。所以,就是说用户在使用一个产品时是有一个新鲜感期,过了这一段时间以后,他感觉就会下降,甚至会流失。比如像这款游戏,在第20轴到25轴的流失风险非常高,60%处于高流失风险的状态。再看很多网页应用或者一些手机APP,它的拐点会更早出现,使用这个业务一到两个月就可能会处于高流失风险的状态。我们通过数据怎么快速定位?如何预计这些用户的流失以及帮到产品经理理解它为什么会流失?建议他在产品运营时要策划什么样的活动?
这是一个完整的生命周期管理图,整个周期里面可以分为几个大的阶段,一个是萌芽期、成长期、衰退期等。我今天主要聚焦在两个阶段,也是腾讯认为最容易出效果的。因为我们工作都有KPI,我们的KPI是通过数据能够帮产品经理带来收入,或者带来活跃用户量。
上述游戏案例其实是一个真实的应用。这个应用在横轴是加入应用的时间,纵轴是人均操作次数,即用户活跃度。从这个线能看到,这些用户在购买这个业务前肯定有很多免费的操作才能刺激他购买这个应用。他打算购买前,活跃度突然变得比较高,他购买后,活跃度开始迅猛地增加。
有很多产品的价值传递不一定非常到位,所以我们往往看到很多产品在第一个月和第二个月的流失率非常高。因为作为一个新用户,如果你的新手教程做得不是很好,或者你的产品不是简单易用,你认为你有很多的价值点用户没有感受到,可能就会流失,而且这个比例非常高。所以,我们会聚焦在帮产品经理去研究说什么样特征的用户在这期间会流失得很快,然后我们把它定位出来。定位出来以后,我们要知道它是由于什么样原因想离开这个应用,或者想离开这个游戏,做快速预警。
【如何利用大数据分析进行精准定位】
另外一个阶段是拉新阶段,比如有的产品经理想快速发展新用户,我们用什么样的数据支撑让它更精准定位到用户?
目前,我们将新应用的用户高流失预防暂分两个阶段。
我们有很多历史数据可以学习,即什么特征用户有可能成为新用户。这个数据以及它的各种可能性的特征我们都可以采集到。然后我们再用机械学习的办法——主要用“决策树”的办法研究什么特征的用户能够成为新用户。比如买房用户,如果小孩有四五岁时他还没有房,而且又有一定的经济能力,他是不是拥有很强的买房需求?这里有很多特征和他购买的驱动力非常相关。
我们通过500多个字段预测用户下一阶段的转化率。“决策树”是得到一个知识树的结构,我们找了比较重要转化率较高的几个树枝去做运营,比如将潜在用户划分成七类用户,每类用户的转化率、它转化概率跟普通用户的转化率的倍数都知道。知道这个特征以后,就可以定位这个用户,然后把这个用户对应的ID给到产品经理,比如这里面有三群很重要的用户,转化概率又比较高,而且我们知道他喜欢什么?
因为“决策树”能识别出他的特征出来。这可以建议你对这些用户,比如他喜欢玩虚拟空间装扮,你的业务又刚好对应这个,你就可以策划一些活动,拉动他冲动性消费,他就更容易购买这个业务。
刚才我说到500多个变量,500多个字段里面,最后有用的可能也就10来个。有用的10来个里面,很重要的发现是斜率型的变量,或者增长型的变量很重要。
这个是什么概念呢?比如我要买车,我可能在买车前一个月突然会对汽车类的网站,或者汽车类论坛的浏览量可能比前几个月流量要多得多,这很正常。流量的突增其实意味着我有更明显的购买意向。因此,我们在设计变量时,除了常规型、状态型统计变量和简单的统计量,还要考虑设计一些增长型变量。增长型变量其实在预测用户在转化过程中更有效。
这是我们在拉新阶段用到的一个方法,又是防流失的一个办法,还是用特征识别的办法识别有哪些特征的用户流失的可能性高的一个办法。
比如这里面是一个决策树的案例,用户在使用背景音乐盒每周的操作次数少于1.5次的时候,他的流失可能性达到30%。另外,如果说他每周使用都不到1次,它的流失可能性将更高,达到65%。所以,它是有一个规则,简单写一个SQL就能把这个用户找出来。假设这个条件,同时满足这个条件的用户能筛选出来,而且我们知道流失的原因。是因为音乐盒的操作次数变少还是别的什么原因。然后,我们有针对性地在这方面做活动或者做一些文章,让他更多地体验这个业务的一些价值点。处于高流失风险状态下的他很可能就会流回来。
另外一个是我们每周都会给对应的用户ID打分,它这周28分,下一周39分。哪一些用户会接触它呢?一是流失分数超过10%,即第二周比第一周的流失风险要高于10%,第二种是绝对值大于40%的流失风险,这两个用户我们都要把他定位出来,完后要做相应的产品改进,或者对他们做一些促销,或者一些产品运营活动。从决策树上,我们可以看到哪些方面是用户的主要诱因。这是我们产品的一个效果。我们做特征识别以后,点击率比产品经理平常拍脑袋做的点击率都有不同程度地提升,比如75%,88%等,甚至有的达到翻倍地提升。
做完这还不够,比如音乐盒的操作小于1.5次,每周大盘的使用情况不到一次,这些规则可以通过数据挖掘算出。
另外,我们定位的每一波人群固化下来,刚才我们看到七类用户,其中三类用户是比较重要的,我们就可以把他固化下来,只要他满足这个特征就可以把他归类到这类用户里面,产品经理也对他们做了有效的活动,把这个有效的活动规划下来。如果用户来到这个应用,他满足这个条件,我们后面就可以自动化推荐这个活动。这样,产品经理就不用苦于说我经常要分析我的用户流失情况是怎么样,我的用户流失怎么定位等,这样就节省很多烦琐的非常专业性的事情,它就可以去更聚焦在他的产品创意上,数据挖掘就更聚焦在准确度上。
上述方法论其实也固化在我们给到开发者的一个工具上面,叫腾讯分析和移动分析。在这两个工具上我们做了数据的储备,包括4000多台数据的集群,包括每天新增100TB的统计数据。我们在用户里面已经可以达到10秒的延迟,在外部给开发商可以更高,而这这是开放的一个里程碑。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
机器学习解决实际问题的核心关键:从业务到落地的全流程解析 在人工智能技术落地的浪潮中,机器学习作为核心工具,已广泛应用于 ...
2025-09-09SPSS 编码状态区域中 Unicode 的功能与价值解析 在 SPSS(Statistical Product and Service Solutions,统计产品与服务解决方案 ...
2025-09-09CDA 数据分析师:驾驭商业数据分析流程的核心力量 在商业决策从 “经验驱动” 向 “数据驱动” 转型的过程中,商业数据分析总体 ...
2025-09-09R 语言:数据科学与科研领域的核心工具及优势解析 一、引言 在数据驱动决策的时代,无论是科研人员验证实验假设(如前文中的 T ...
2025-09-08T 检验在假设检验中的应用与实践 一、引言 在科研数据分析、医学实验验证、经济指标对比等领域,常常需要判断 “样本间的差异是 ...
2025-09-08在商业竞争日益激烈的当下,“用数据说话” 已从企业的 “加分项” 变为 “生存必需”。然而,零散的数据分析无法持续为业务赋能 ...
2025-09-08随机森林算法的核心特点:原理、优势与应用解析 在机器学习领域,随机森林(Random Forest)作为集成学习(Ensemble Learning) ...
2025-09-05Excel 区域名定义:从基础到进阶的高效应用指南 在 Excel 数据处理中,频繁引用单元格区域(如A2:A100、B3:D20)不仅容易出错, ...
2025-09-05CDA 数据分析师:以六大分析方法构建数据驱动业务的核心能力 在数据驱动决策成为企业共识的当下,CDA(Certified Data Analyst) ...
2025-09-05SQL 日期截取:从基础方法到业务实战的全维度解析 在数据处理与业务分析中,日期数据是连接 “业务行为” 与 “时间维度” 的核 ...
2025-09-04在卷积神经网络(CNN)的发展历程中,解决 “梯度消失”“特征复用不足”“模型参数冗余” 一直是核心命题。2017 年提出的密集连 ...
2025-09-04CDA 数据分析师:驾驭数据范式,释放数据价值 在数字化转型浪潮席卷全球的当下,数据已成为企业核心生产要素。而 CDA(Certified ...
2025-09-04K-Means 聚类:无监督学习中数据分群的核心算法 在数据分析领域,当我们面对海量无标签数据(如用户行为记录、商品属性数据、图 ...
2025-09-03特征值、特征向量与主成分:数据降维背后的线性代数逻辑 在机器学习、数据分析与信号处理领域,“降维” 是破解高维数据复杂性的 ...
2025-09-03CDA 数据分析师与数据分析:解锁数据价值的关键 在数字经济高速发展的今天,数据已成为企业核心资产与社会发展的重要驱动力。无 ...
2025-09-03解析 loss.backward ():深度学习中梯度汇总与同步的自动触发核心 在深度学习模型训练流程中,loss.backward()是连接 “前向计算 ...
2025-09-02要解答 “画 K-S 图时横轴是等距还是等频” 的问题,需先明确 K-S 图的核心用途(检验样本分布与理论分布的一致性),再结合横轴 ...
2025-09-02CDA 数据分析师:助力企业破解数据需求与数据分析需求难题 在数字化浪潮席卷全球的当下,数据已成为企业核心战略资产。无论是市 ...
2025-09-02Power BI 度量值实战:基于每月收入与税金占比计算累计税金分摊金额 在企业财务分析中,税金分摊是成本核算与利润统计的核心环节 ...
2025-09-01巧用 ALTER TABLE rent ADD INDEX:租房系统数据库性能优化实践 在租房管理系统中,rent表是核心业务表之一,通常存储租赁订单信 ...
2025-09-01