京公网安备 11010802034615号
经营许可证编号:京B2-20210330
用数据管理“用户生命周期”
腾讯的精细化运营是如何贯穿于整个产品过程中的?
腾讯用到一个很重要的方法,即用户生命周期管理办法。这也是社交网络事业群正在力推的一个很重要的方法论。
什么叫用户生命周期管理?传统营销学讲的是客户生命周期管理,因为腾讯社交群主要客户就是用户,所以我们叫用户生命周期管理。但是传统的对应的理论是客户生命周期管理,简称CLM。《王永庆传》提到一个一个米店老板怎么做生意,他每天会收集顾客用米的情况,包括家里有多少成员,然后能估计到他每天吃多少米,然后推算出这个家庭什么时候能把米吃完。比如买10公斤大米,估计是半个月,到快吃完时,他就会主动送货上门,或者主动打电话。他用这种办法赢得了客户。很快他的经营网络就超过了其他店。
再比如一个游戏数据图表,横轴是游戏用户使用时长,纵轴是活跃用户量。第20轴到25轴用户分两波,有60%的用户活跃用户量下滑得比较明显,还有一波用户是相对保持。所以,就是说用户在使用一个产品时是有一个新鲜感期,过了这一段时间以后,他感觉就会下降,甚至会流失。比如像这款游戏,在第20轴到25轴的流失风险非常高,60%处于高流失风险的状态。再看很多网页应用或者一些手机APP,它的拐点会更早出现,使用这个业务一到两个月就可能会处于高流失风险的状态。我们通过数据怎么快速定位?如何预计这些用户的流失以及帮到产品经理理解它为什么会流失?建议他在产品运营时要策划什么样的活动?
这是一个完整的生命周期管理图,整个周期里面可以分为几个大的阶段,一个是萌芽期、成长期、衰退期等。我今天主要聚焦在两个阶段,也是腾讯认为最容易出效果的。因为我们工作都有KPI,我们的KPI是通过数据能够帮产品经理带来收入,或者带来活跃用户量。
上述游戏案例其实是一个真实的应用。这个应用在横轴是加入应用的时间,纵轴是人均操作次数,即用户活跃度。从这个线能看到,这些用户在购买这个业务前肯定有很多免费的操作才能刺激他购买这个应用。他打算购买前,活跃度突然变得比较高,他购买后,活跃度开始迅猛地增加。
有很多产品的价值传递不一定非常到位,所以我们往往看到很多产品在第一个月和第二个月的流失率非常高。因为作为一个新用户,如果你的新手教程做得不是很好,或者你的产品不是简单易用,你认为你有很多的价值点用户没有感受到,可能就会流失,而且这个比例非常高。所以,我们会聚焦在帮产品经理去研究说什么样特征的用户在这期间会流失得很快,然后我们把它定位出来。定位出来以后,我们要知道它是由于什么样原因想离开这个应用,或者想离开这个游戏,做快速预警。
【如何利用大数据分析进行精准定位】
另外一个阶段是拉新阶段,比如有的产品经理想快速发展新用户,我们用什么样的数据支撑让它更精准定位到用户?
目前,我们将新应用的用户高流失预防暂分两个阶段。
我们有很多历史数据可以学习,即什么特征用户有可能成为新用户。这个数据以及它的各种可能性的特征我们都可以采集到。然后我们再用机械学习的办法——主要用“决策树”的办法研究什么特征的用户能够成为新用户。比如买房用户,如果小孩有四五岁时他还没有房,而且又有一定的经济能力,他是不是拥有很强的买房需求?这里有很多特征和他购买的驱动力非常相关。
我们通过500多个字段预测用户下一阶段的转化率。“决策树”是得到一个知识树的结构,我们找了比较重要转化率较高的几个树枝去做运营,比如将潜在用户划分成七类用户,每类用户的转化率、它转化概率跟普通用户的转化率的倍数都知道。知道这个特征以后,就可以定位这个用户,然后把这个用户对应的ID给到产品经理,比如这里面有三群很重要的用户,转化概率又比较高,而且我们知道他喜欢什么?
因为“决策树”能识别出他的特征出来。这可以建议你对这些用户,比如他喜欢玩虚拟空间装扮,你的业务又刚好对应这个,你就可以策划一些活动,拉动他冲动性消费,他就更容易购买这个业务。
刚才我说到500多个变量,500多个字段里面,最后有用的可能也就10来个。有用的10来个里面,很重要的发现是斜率型的变量,或者增长型的变量很重要。
这个是什么概念呢?比如我要买车,我可能在买车前一个月突然会对汽车类的网站,或者汽车类论坛的浏览量可能比前几个月流量要多得多,这很正常。流量的突增其实意味着我有更明显的购买意向。因此,我们在设计变量时,除了常规型、状态型统计变量和简单的统计量,还要考虑设计一些增长型变量。增长型变量其实在预测用户在转化过程中更有效。
这是我们在拉新阶段用到的一个方法,又是防流失的一个办法,还是用特征识别的办法识别有哪些特征的用户流失的可能性高的一个办法。
比如这里面是一个决策树的案例,用户在使用背景音乐盒每周的操作次数少于1.5次的时候,他的流失可能性达到30%。另外,如果说他每周使用都不到1次,它的流失可能性将更高,达到65%。所以,它是有一个规则,简单写一个SQL就能把这个用户找出来。假设这个条件,同时满足这个条件的用户能筛选出来,而且我们知道流失的原因。是因为音乐盒的操作次数变少还是别的什么原因。然后,我们有针对性地在这方面做活动或者做一些文章,让他更多地体验这个业务的一些价值点。处于高流失风险状态下的他很可能就会流回来。
另外一个是我们每周都会给对应的用户ID打分,它这周28分,下一周39分。哪一些用户会接触它呢?一是流失分数超过10%,即第二周比第一周的流失风险要高于10%,第二种是绝对值大于40%的流失风险,这两个用户我们都要把他定位出来,完后要做相应的产品改进,或者对他们做一些促销,或者一些产品运营活动。从决策树上,我们可以看到哪些方面是用户的主要诱因。这是我们产品的一个效果。我们做特征识别以后,点击率比产品经理平常拍脑袋做的点击率都有不同程度地提升,比如75%,88%等,甚至有的达到翻倍地提升。
做完这还不够,比如音乐盒的操作小于1.5次,每周大盘的使用情况不到一次,这些规则可以通过数据挖掘算出。
另外,我们定位的每一波人群固化下来,刚才我们看到七类用户,其中三类用户是比较重要的,我们就可以把他固化下来,只要他满足这个特征就可以把他归类到这类用户里面,产品经理也对他们做了有效的活动,把这个有效的活动规划下来。如果用户来到这个应用,他满足这个条件,我们后面就可以自动化推荐这个活动。这样,产品经理就不用苦于说我经常要分析我的用户流失情况是怎么样,我的用户流失怎么定位等,这样就节省很多烦琐的非常专业性的事情,它就可以去更聚焦在他的产品创意上,数据挖掘就更聚焦在准确度上。
上述方法论其实也固化在我们给到开发者的一个工具上面,叫腾讯分析和移动分析。在这两个工具上我们做了数据的储备,包括4000多台数据的集群,包括每天新增100TB的统计数据。我们在用户里面已经可以达到10秒的延迟,在外部给开发商可以更高,而这这是开放的一个里程碑。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在互联网产品运营、用户增长的实战场景中,很多从业者都会陷入一个误区:盲目投入资源做推广、拉新,却忽视了“拉新后的用户激活 ...
2026-02-06在机器学习建模过程中,特征选择是决定模型性能的关键环节——面对动辄几十、上百个特征的数据(如用户画像的几十项维度、企业经 ...
2026-02-06在CDA(Certified Data Analyst)数据分析师的日常实操中,表格结构数据是贯穿全流程的核心载体,而对表格数据类型的精准识别、 ...
2026-02-06在日常办公数据分析中,我们经常会面对杂乱无章的批量数据——比如员工月度绩效、产品销售数据、客户消费金额、月度运营指标等。 ...
2026-02-05在分类模型(如风控反欺诈、医疗疾病诊断、客户流失预警)的实操落地中,ROC曲线是评估模型区分能力的核心工具,而阈值则是连接 ...
2026-02-05对CDA(Certified Data Analyst)数据分析师而言,数据分析的价值不仅在于挖掘数据背后的规律与洞察,更在于通过专业的报告呈现 ...
2026-02-05在数据分析实战中,我们经常会遇到“多指标冗余”的问题——比如分析企业经营状况时,需同时关注营收、利润、负债率、周转率等十 ...
2026-02-04在数据分析场景中,基准比是衡量指标表现、评估业务成效、对比个体/群体差异的核心工具,广泛应用于绩效评估、业务监控、竞品对 ...
2026-02-04业务数据分析是企业日常运营的核心支撑,其核心价值在于将零散的业务数据转化为可落地的业务洞察,破解运营痛点、优化业务流程、 ...
2026-02-04在信贷业务中,违约率是衡量信贷资产质量、把控信用风险、制定风控策略的核心指标,其统计分布特征直接决定了风险定价的合理性、 ...
2026-02-03在数字化业务迭代中,AB测试已成为验证产品优化、策略调整、运营活动效果的核心工具。但多数业务场景中,单纯的“AB组差异对比” ...
2026-02-03企业战略决策的科学性,决定了其长远发展的格局与竞争力。战略分析方法作为一套系统化、专业化的思维工具,为企业研判行业趋势、 ...
2026-02-03在统计调查与数据分析中,抽样方法分为简单随机抽样与复杂抽样两大类。简单随机抽样因样本均匀、计算简便,是基础的抽样方式,但 ...
2026-02-02在数据驱动企业发展的今天,“数据分析”已成为企业经营决策的核心支撑,但实践中,战略数据分析与业务数据分析两个概念常被混淆 ...
2026-02-02在数据驱动企业发展的今天,“数据分析”已成为企业经营决策的核心支撑,但实践中,战略数据分析与业务数据分析两个概念常被混淆 ...
2026-02-02B+树作为数据库索引的核心数据结构,其高效的查询、插入、删除性能,离不开节点间指针的合理设计。在日常学习和数据库开发中,很 ...
2026-01-30在数据库开发中,UUID(通用唯一识别码)是生成唯一主键、唯一标识的常用方式,其标准格式包含4个短横线(如550e8400-e29b-41d4- ...
2026-01-30商业数据分析的价值落地,离不开标准化、系统化的总体流程作为支撑;而CDA(Certified Data Analyst)数据分析师,作为经过系统 ...
2026-01-30在数据分析、质量控制、科研实验等场景中,数据波动性(离散程度)的精准衡量是判断数据可靠性、稳定性的核心环节。标准差(Stan ...
2026-01-29在数据分析、质量检测、科研实验等领域,判断数据间是否存在本质差异是核心需求,而t检验、F检验是实现这一目标的经典统计方法。 ...
2026-01-29