京公网安备 11010802034615号
经营许可证编号:京B2-20210330
你会不会正在做无意义的数据分析?
并没有符合你的预期,活跃度?
假设活跃度的口径,是用户当天用过登录app的记录
问题1、登录app的用户真的就算是活跃了吗?
问题2、后台记录的登录条件上是否有限制?push页进来的也算登录吗,还是一定要首页进来的?
问题3、统计量下的活跃用户真的是有价值的客户,可以为后续的转化提供基础,没有噪声用户的吗?
1、常用的用户数据指标有哪些?
理解“日活/月活度数据指标”-使用场景
到底活跃对我们意味着什么?
活跃用户,是相对于“流失用户”的一个概念,是指那些会时不时地光顾下app,并为app业务带来一些价值的用户。
活跃用户是一个公司讲故事的资本。针对的是小型的,有融资需求的公司,如果一个公司有百万以上的日活用户,即使没有盈利,依然会受到投资人的青睐,变现是小事,有没有用户使用才是大事。现在产品的变现方式已经很成熟,有百万用户的产品通过接入广告,也可以获得一些收益。
在用户活跃分析的时候,不是为了逼用户天天来戳一下,而是为付费、或者其他转化提供稳定的支持,那么选择活跃度指标时需要考量公司的业务目标。
理解“日活/月活度数据指标”-日和月的定义
日:一般我们指一个自然日,即0:00–24:00
月:上个月的1号0点-当月最后一天的23点59分
月活跃用户的计算逻辑是什么?
A、每一天的活跃用户的累加(或者取平均值)
B、这个月所有活跃用户去重的总数
理解“日活/月活度数据指标”--活跃的定义
活跃度的几种口径
A、检测到用户的登录信息(一些强登录的app,例如网银、网游)
B、指定多个页面的埋点数据上报
C、通过后台带用户信息或者用户ip的请求信息(无账号APP)
D、停留指定页面超过一定时长
理解“用户日活/月活度数据指标”--活跃的定义
理解“增量数据指标”--新增用户的使用场景
对“新增用户”的定义实际上是通过用户新增的后续行为进行一个简单的用户分层,满足当前运营阶段的“关键指标”的用户作为有效新增用户,也是后续运营的重点用户。
在定义好“新增用户”的指标后,拉新行为也就并不是只看重下载和打开,而是围绕核心指标进行优化,例如以注册为指标,需要通过观察用户的注册行为路径优化注册流程体验。
理解“增量数据指标”--新增用户的定义
在目前的“新增用户”的定义中,总的来说,可以分为两种方式:
一种方式为一段时间内打开应用的新用户数量,这是广义的新增用户。
另一种方式为一段时间内产生过“关键行为”的新用户数量,比如:注册账号,激活账户,而对于增长黑客而言,则更关注第二种“新增用户”。
理解“留存率”--留存率的使用场景
用户留存率是验证产品用户吸引力很重要的指标。通常可以利用用户留存率与竞品进行对比,衡量应用对用户的吸引力。对于某一个相对成熟版本的应用,如果用户留存率有明显变化,则说明用户质量有明显变化,很可能是因为推广渠道质量的变化所引起的。
理解“增量数据指标”--新增用户的使用场景
对“新增用户”的定义实际上是通过用户新增的后续行为进行一个简单的用户分层,满足当前运营阶段的“关键指标”的用户作为有效新增用户,也是后续运营的重点用户。
在定义好“新增用户”的指标后,拉新行为也就并不是只看重下载和打开,而是围绕核心指标进行优化,例如以注册为指标,需要通过观察用户的注册行为路径优化注册流程体验。
理解“增量数据指标”--新增用户的定义
在目前的“新增用户”的定义中,总的来说,可以分为两种方式:
一种方式为一段时间内打开应用的新用户数量,这是广义的新增用户。
另一种方式为一段时间内产生过“关键行为”的新用户数量,比如:注册账号,激活账户,而对于增长黑客而言,则更关注第二种“新增用户”。
理解“留存率”--留存率的使用场景
用户留存率是验证产品用户吸引力很重要的指标。通常可以利用用户留存率与竞品进行对比,衡量应用对用户的吸引力。对于某一个相对成熟版本的应用,如果用户留存率有明显变化,则说明用户质量有明显变化,很可能是因为推广渠道质量的变化所引起的。
理解“留存率”--留存率的含义
留存指的是:一批新增用户中,在指定的时间段内,没有卸载的用户(app场景)。
新增账号第X日:某日新增的账号中,在新增日后第X日有登录行为记为留存
新增账号X日内:某日新增的账号中,在新增日后的X日内有登录行为记为留存
活跃账号第X日:某日活跃的账号中,在新增日后第X日有登录行为记为留存
活跃账号X日内:某日活跃的账号中,在新增日后的X日内有登录行为记为留存
其他的基础指标的定义
2、哪些指标需要做指标预警
A.指标跟业务挂钩。可以做指标的变量很多,但是可以拿来做预警的却不多,选择直接跟指标挂钩的。例如电商,直接就是销售量,接口就是调用次数,产品就是环节转化,运营就是用户增长量
B.避免预警指标过剩,造成指标预警不重视,你设定报警的指标,一定是要真的很严重,你才能推送的那种,不要设置不严重的,但是造成邮件泛滥,没人理会预警就得不偿失了。
C.预警指标需要做重要性排序,先实现会经常出现异常导致你经常加班分析的指标,先实现在业务层面的重要指标,预警指标推送时间不要挤在一起,不然你同时接受多个预警,你不会仔细去看,而且要是都是异常的话,一下子那么多异常出来,你会心慌,那么分析思路就不那么清晰了。
3、指标预警的大类
接口类的数据指标预警(主要用于it部门监控接口或者平台功能稳定),模型准确率
产品类指标的数据指标预警(主要是产品部门用于监控产品功能的转化,产品的访问之类的)
运营类指标的数据预警(主要是运营部门用于监控用户的信息,例如用户的激增,或者用户的大幅度访问下降。)
1、比率占比法
其实就是看各个区间的占比是否跟之前的比较接近,但是这里需要注意的是,不要把“之前”拉的太长,一般是最近7天或者最近3天就可以了。那么这个时段之前的占比(或数据量),这个占比有以下几种方法可以参考:
A.就是计算过去几天的每个时段的平均占比(或数据量)。
B.过去7天,按照距离的时间越长,那么权重变少,例如最近往前推一天是0.5,最近往前推二天是0.3,这样子的权重计算。
C.就是只用过去一天的数据做对比,但是这个不太实际,不过也要看你的业务是怎样的。
2、统计方法
A.时间序列分析。数据量在时间序列上是可以有规律可以遵循的,所以可以利用时间序列分析的方法,预测当天的数据量,若实际与预测的数据量作差值,相差太多则触发指标预警推送。(这种方法不推荐,在理论上可以过得去,但是实际的运用其实相对复杂并且效果也不一定好)
B.相关系数计算。第一点的占比法中,需要每个时段都去计算差别,产生的指标就会多,一旦这种数据量的类型多起来,就会很复杂,所以可以将这些占比列成一个向量,计算今天与之前的数据量组成的向量的相关系数的大小,当太小的时候,主动触发预警。
3、差值&定值法
这个方法是最简单的,这个在模型监控中常用到,其实就是将原先的模型效果与现在的模型效果做比较,或者直接计算模型KS后者auc值看是否低于某值,则预警,但是这里注意的是,这种模型的预警一般没办法以天为周期计算,因为模型的y值往往是有滞后性的。
4、孤立点检测
对比以上几个在单一维度上的方法,孤立点检测是基于多维度建立的向量来观察异常数据点的方法。
指标预警的方式-钉钉机器人&企业微信机器人通知
钉钉机器人还有企业微信机器人都设置了群机器人的功能,大部分的开发会拿来检测任务是否正常运行,或者定时任务是否完成运行的提醒,所以你也可以拿来作为你的指标预警推送,网上都有响应的教程可以作为参考,写python即可实现。
钉钉机器人详细介绍链接:
https://developers.dingtalk.com/document/app/custom-robot-access
企业微信机器人:
https://work.weixin.qq.com/api/doc/90000/90136/91770
指标预警的方式-邮件通知
当公司没有第一点的软件,或者机器不能链接外网的时候,可以借助邮件推送的方式,利用python中的smtplib包实现。
指标预警的方式-平台推送
到了特地为每个分析师都开发了这个预警平台或者自研的bi平台可以满足预警推送的功能化,也可以通过平台推送,这个话可能涉及的东西相对多一些,如果你会写接口,借助django框架写接口之后吐给前端去帮你展示也是可以的。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
用户调研是企业洞察客户需求、优化产品服务、制定运营策略的核心前提,而调研数据的可靠性,直接决定了决策的科学性与有效性。在 ...
2026-05-11在市场竞争日趋激烈、流量成本持续攀升的今天,企业的核心竞争力已从“获取流量”转向“挖掘客户价值”。客户作为企业最宝贵的资 ...
2026-05-11 很多数据分析师精通Excel单元格操作,熟练应用多种公式,但当被问到“表结构数据的基本处理单位是什么”“字段和记录的本质 ...
2026-05-11在互联网运营、产品优化、用户增长等领域,次日留存率是衡量产品价值、用户粘性与运营效果的核心指标,更是判断新用户是否认可产 ...
2026-05-09相关性分析是数据分析领域中用于探究两个或多个变量之间关联强度与方向的核心方法,广泛应用于科研探索、商业决策、医疗研究、社 ...
2026-05-09 数据分析师八成以上的时间在和数据表格打交道,但许多人拿到Excel后习惯性地先算、先分析,结果回头发现漏了一列关键数据, ...
2026-05-09在数据驱动运营的时代,指标是连接业务目标与实际行动的核心桥梁,是企业解读业务现状、发现问题、预判趋势的“量化标尺”。一套 ...
2026-05-08在存量竞争日趋激烈的商业时代,“以客户为中心”早已从口号落地为企业运营的核心逻辑。而客户画像作为打通“了解客户”与“服务 ...
2026-05-08 很多数据分析师每天与Excel打交道,但当被问到“什么是表格结构数据”“它和表结构数据有什么区别”“表格结构数据有哪些核 ...
2026-05-08在数据分析、计量研究等场景中,回归分析是探究变量间量化关系的核心方法,无论是简单的一元线性回归,还是复杂的多元线性回归、 ...
2026-05-07在数据分析、计量研究等场景中,回归分析是探究变量间量化关系的核心方法,无论是简单的一元线性回归,还是复杂的多元线性回归、 ...
2026-05-07 很多数据分析师画过趋势图、做过业绩预测,但当被问到“这个月销售额增长20%,到底是长期趋势自然增长,还是促销活动的短期 ...
2026-05-07在数字化时代,商业竞争的核心已从“经验驱动”转向“数据驱动”,越来越多的企业意识到,商业分析不是简单的数据统计与报表呈现 ...
2026-05-06在Excel数据透视表的实操中,“引用”是连接透视表与公式、辅助数据的核心操作,而相对引用作为最基础、最常用的引用方式,其设 ...
2026-05-06 很多数据分析师做过按月份的销售额趋势图,画过按天的流量折线图,但当被问到“时间序列和普通数据有什么本质区别”“季节性 ...
2026-05-06在Excel数据分析中,数据透视表是汇总、整理海量数据的高效工具,而公式则是实现数据二次计算、逻辑判断的核心功能。实际操作中 ...
2026-04-30Excel透视图是数据分析中不可或缺的工具,它能将透视表中的数据快速可视化,帮助我们直观捕捉数据规律、呈现分析结果。但在实际 ...
2026-04-30 很多数据分析师能熟练地计算指标、搭建标签体系,但当被问到“画像到底在解决什么问题”“画像和标签是什么关系”“画像如何 ...
2026-04-30在中介效应分析中,人口统计学变量(如年龄、性别、学历、收入、职业等)是常见的控制变量或调节变量,其处理方式直接影响分析结 ...
2026-04-29在SQL数据库实操中,日期数据的存储与显示是高频需求,而“数字日期”(如20240520、20241231、45321)是很多开发者、数据分析师 ...
2026-04-29