京公网安备 11010802034615号
经营许可证编号:京B2-20210330
用数据管理“用户生命周期”
腾讯的精细化运营是如何贯穿于整个产品过程中的?
腾讯用到一个很重要的方法,即用户生命周期管理办法。这也是社交网络事业群正在力推的一个很重要的方法论。
什么叫用户生命周期管理?传统营销学讲的是客户生命周期管理,因为腾讯社交群主要客户就是用户,所以我们叫用户生命周期管理。但是传统的对应的理论是客户生命周期管理,简称CLM。《王永庆传》提到一个一个米店老板怎么做生意,他每天会收集顾客用米的情况,包括家里有多少成员,然后能估计到他每天吃多少米,然后推算出这个家庭什么时候能把米吃完。比如买10公斤大米,估计是半个月,到快吃完时,他就会主动送货上门,或者主动打电话。他用这种办法赢得了客户。很快他的经营网络就超过了其他店。
再比如一个游戏数据图表,横轴是游戏用户使用时长,纵轴是活跃用户量。第20轴到25轴用户分两波,有60%的用户活跃用户量下滑得比较明显,还有一波用户是相对保持。所以,就是说用户在使用一个产品时是有一个新鲜感期,过了这一段时间以后,他感觉就会下降,甚至会流失。比如像这款游戏,在第20轴到25轴的流失风险非常高,60%处于高流失风险的状态。再看很多网页应用或者一些手机APP,它的拐点会更早出现,使用这个业务一到两个月就可能会处于高流失风险的状态。我们通过数据怎么快速定位?如何预计这些用户的流失以及帮到产品经理理解它为什么会流失?建议他在产品运营时要策划什么样的活动?
这是一个完整的生命周期管理图,整个周期里面可以分为几个大的阶段,一个是萌芽期、成长期、衰退期等。我今天主要聚焦在两个阶段,也是腾讯认为最容易出效果的。因为我们工作都有KPI,我们的KPI是通过数据能够帮产品经理带来收入,或者带来活跃用户量。
上述游戏案例其实是一个真实的应用。这个应用在横轴是加入应用的时间,纵轴是人均操作次数,即用户活跃度。从这个线能看到,这些用户在购买这个业务前肯定有很多免费的操作才能刺激他购买这个应用。他打算购买前,活跃度突然变得比较高,他购买后,活跃度开始迅猛地增加。
有很多产品的价值传递不一定非常到位,所以我们往往看到很多产品在第一个月和第二个月的流失率非常高。因为作为一个新用户,如果你的新手教程做得不是很好,或者你的产品不是简单易用,你认为你有很多的价值点用户没有感受到,可能就会流失,而且这个比例非常高。所以,我们会聚焦在帮产品经理去研究说什么样特征的用户在这期间会流失得很快,然后我们把它定位出来。定位出来以后,我们要知道它是由于什么样原因想离开这个应用,或者想离开这个游戏,做快速预警。
【如何利用大数据分析进行精准定位】
另外一个阶段是拉新阶段,比如有的产品经理想快速发展新用户,我们用什么样的数据支撑让它更精准定位到用户?
目前,我们将新应用的用户高流失预防暂分两个阶段。
我们有很多历史数据可以学习,即什么特征用户有可能成为新用户。这个数据以及它的各种可能性的特征我们都可以采集到。然后我们再用机械学习的办法——主要用“决策树”的办法研究什么特征的用户能够成为新用户。比如买房用户,如果小孩有四五岁时他还没有房,而且又有一定的经济能力,他是不是拥有很强的买房需求?这里有很多特征和他购买的驱动力非常相关。
我们通过500多个字段预测用户下一阶段的转化率。“决策树”是得到一个知识树的结构,我们找了比较重要转化率较高的几个树枝去做运营,比如将潜在用户划分成七类用户,每类用户的转化率、它转化概率跟普通用户的转化率的倍数都知道。知道这个特征以后,就可以定位这个用户,然后把这个用户对应的ID给到产品经理,比如这里面有三群很重要的用户,转化概率又比较高,而且我们知道他喜欢什么?
因为“决策树”能识别出他的特征出来。这可以建议你对这些用户,比如他喜欢玩虚拟空间装扮,你的业务又刚好对应这个,你就可以策划一些活动,拉动他冲动性消费,他就更容易购买这个业务。
刚才我说到500多个变量,500多个字段里面,最后有用的可能也就10来个。有用的10来个里面,很重要的发现是斜率型的变量,或者增长型的变量很重要。
这个是什么概念呢?比如我要买车,我可能在买车前一个月突然会对汽车类的网站,或者汽车类论坛的浏览量可能比前几个月流量要多得多,这很正常。流量的突增其实意味着我有更明显的购买意向。因此,我们在设计变量时,除了常规型、状态型统计变量和简单的统计量,还要考虑设计一些增长型变量。增长型变量其实在预测用户在转化过程中更有效。
这是我们在拉新阶段用到的一个方法,又是防流失的一个办法,还是用特征识别的办法识别有哪些特征的用户流失的可能性高的一个办法。
比如这里面是一个决策树的案例,用户在使用背景音乐盒每周的操作次数少于1.5次的时候,他的流失可能性达到30%。另外,如果说他每周使用都不到1次,它的流失可能性将更高,达到65%。所以,它是有一个规则,简单写一个SQL就能把这个用户找出来。假设这个条件,同时满足这个条件的用户能筛选出来,而且我们知道流失的原因。是因为音乐盒的操作次数变少还是别的什么原因。然后,我们有针对性地在这方面做活动或者做一些文章,让他更多地体验这个业务的一些价值点。处于高流失风险状态下的他很可能就会流回来。
另外一个是我们每周都会给对应的用户ID打分,它这周28分,下一周39分。哪一些用户会接触它呢?一是流失分数超过10%,即第二周比第一周的流失风险要高于10%,第二种是绝对值大于40%的流失风险,这两个用户我们都要把他定位出来,完后要做相应的产品改进,或者对他们做一些促销,或者一些产品运营活动。从决策树上,我们可以看到哪些方面是用户的主要诱因。这是我们产品的一个效果。我们做特征识别以后,点击率比产品经理平常拍脑袋做的点击率都有不同程度地提升,比如75%,88%等,甚至有的达到翻倍地提升。
做完这还不够,比如音乐盒的操作小于1.5次,每周大盘的使用情况不到一次,这些规则可以通过数据挖掘算出。
另外,我们定位的每一波人群固化下来,刚才我们看到七类用户,其中三类用户是比较重要的,我们就可以把他固化下来,只要他满足这个特征就可以把他归类到这类用户里面,产品经理也对他们做了有效的活动,把这个有效的活动规划下来。如果用户来到这个应用,他满足这个条件,我们后面就可以自动化推荐这个活动。这样,产品经理就不用苦于说我经常要分析我的用户流失情况是怎么样,我的用户流失怎么定位等,这样就节省很多烦琐的非常专业性的事情,它就可以去更聚焦在他的产品创意上,数据挖掘就更聚焦在准确度上。
上述方法论其实也固化在我们给到开发者的一个工具上面,叫腾讯分析和移动分析。在这两个工具上我们做了数据的储备,包括4000多台数据的集群,包括每天新增100TB的统计数据。我们在用户里面已经可以达到10秒的延迟,在外部给开发商可以更高,而这这是开放的一个里程碑。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
B+树作为数据库索引的核心数据结构,其高效的查询、插入、删除性能,离不开节点间指针的合理设计。在日常学习和数据库开发中,很 ...
2026-01-30在数据库开发中,UUID(通用唯一识别码)是生成唯一主键、唯一标识的常用方式,其标准格式包含4个短横线(如550e8400-e29b-41d4- ...
2026-01-30商业数据分析的价值落地,离不开标准化、系统化的总体流程作为支撑;而CDA(Certified Data Analyst)数据分析师,作为经过系统 ...
2026-01-30在数据分析、质量控制、科研实验等场景中,数据波动性(离散程度)的精准衡量是判断数据可靠性、稳定性的核心环节。标准差(Stan ...
2026-01-29在数据分析、质量检测、科研实验等领域,判断数据间是否存在本质差异是核心需求,而t检验、F检验是实现这一目标的经典统计方法。 ...
2026-01-29统计制图(数据可视化)是数据分析的核心呈现载体,它将抽象的数据转化为直观的图表、图形,让数据规律、业务差异与潜在问题一目 ...
2026-01-29箱线图(Box Plot)作为数据分布可视化的核心工具,能清晰呈现数据的中位数、四分位数、异常值等关键统计特征,广泛应用于数据分 ...
2026-01-28在回归分析、机器学习建模等数据分析场景中,多重共线性是高频数据问题——当多个自变量间存在较强的线性关联时,会导致模型系数 ...
2026-01-28数据分析的价值落地,离不开科学方法的支撑。六种核心分析方法——描述性分析、诊断性分析、预测性分析、规范性分析、对比分析、 ...
2026-01-28在机器学习与数据分析领域,特征是连接数据与模型的核心载体,而特征重要性分析则是挖掘数据价值、优化模型性能、赋能业务决策的 ...
2026-01-27关联分析是数据挖掘领域中挖掘数据间潜在关联关系的经典方法,广泛应用于零售购物篮分析、电商推荐、用户行为路径挖掘等场景。而 ...
2026-01-27数据分析的基础范式,是支撑数据工作从“零散操作”走向“标准化落地”的核心方法论框架,它定义了数据分析的核心逻辑、流程与目 ...
2026-01-27在数据分析、后端开发、业务运维等工作中,SQL语句是操作数据库的核心工具。面对复杂的表结构、多表关联逻辑及灵活的查询需求, ...
2026-01-26支持向量机(SVM)作为机器学习中经典的分类算法,凭借其在小样本、高维数据场景下的优异泛化能力,被广泛应用于图像识别、文本 ...
2026-01-26在数字化浪潮下,数据分析已成为企业决策的核心支撑,而CDA数据分析师作为标准化、专业化的数据人才代表,正逐步成为连接数据资 ...
2026-01-26数据分析的核心价值在于用数据驱动决策,而指标作为数据的“载体”,其选取的合理性直接决定分析结果的有效性。选对指标能精准定 ...
2026-01-23在MySQL查询编写中,我们习惯按“SELECT → FROM → WHERE → ORDER BY”的语法顺序组织语句,直觉上认为代码顺序即执行顺序。但 ...
2026-01-23数字化转型已从企业“可选项”升级为“必答题”,其核心本质是通过数据驱动业务重构、流程优化与模式创新,实现从传统运营向智能 ...
2026-01-23CDA持证人已遍布在世界范围各行各业,包括世界500强企业、顶尖科技独角兽、大型金融机构、国企事业单位、国家行政机关等等,“CDA数据分析师”人才队伍遵守着CDA职业道德准则,发挥着专业技能,已成为支撑科技发展的核心力量。 ...
2026-01-22在数字化时代,企业积累的海量数据如同散落的珍珠,而数据模型就是串联这些珍珠的线——它并非简单的数据集合,而是对现实业务场 ...
2026-01-22