京公网安备 11010802034615号
经营许可证编号:京B2-20210330
移动数据移动互联网应用数据分析基础体系
在2012年及2013年诸多大型互联网公司其移动端的流量已经超越PC端的流量,很多大型互联网企业PC业务用户往移动端迁移,呈现出PC业务增长放缓,移动业务增长迅速的态势。从第三方数据机构统计的数据来看,网民中使用手机上网的人群占比进一步提升,由2013年12月的81.0%提升至2015年6月的88.9%,即中国网民中,接近9成的用户在使用手机上网,达到接近6亿的规模。如果一个互联网企业没有在移动端的拳头产品,将很快被移动互联网的浪潮颠覆。在未来的两三年内,得移动互联网得天下。
从数据看出,移动互联网是互联网发展最重要的方向,因此,对于拥抱互联网的企业来说,设计和运营好移动互联网应用(下文称APP)成为移动互联网时代最重要的任务。而在移动互联网的设计和运营过程中,数据分析起到很基础但也很重要的作用。在互联网企业,任何一个APP都要事先规划好数据体系,才允许上线运营,有了数据才可以更好的科学运营。因此本文将为大家介绍APP的基础数据指标体系。
APP的数据指标体系主要分为五个维度,包括用户规模与质量、参与度分析、渠道分析、功能分析以用户属性分析。用户规模和质量维度主要是分析用户规模指标,这类指标一般为产品考核的重点指标;参与度分析主要分析用户的活跃度;渠道分析主要分析渠道推广效果;功能分析主要分析功能活跃情况、页面访问路径以及转化率;用户属性分析主要分析用户特征。本文将详述这五大维度。
一、用户规模和质量
用户规模和质量的分析包括活跃用户、新增用户、用户构成、用户留存率、每个用户总活跃天数五个常见指标。用户规模和质量是APP分析最重要的维度,其指标也是相对其他维度最多,产品负责人要重点关注这个维度的指标。
(1)活跃用户指标
活跃用户指在某统计周期内启动过应用(APP)的用户。活跃用户数一般按照设备维度统计,即统计一段周期内启动过的设备(如手机、平板电脑)数量。活跃用户是衡量应用用户规模的指标。通常,一个产品是否成功,如果只看一个指标,那么这个指标一定是活跃用户数。很多互联网企业对产品负责人的KPI考核指标都以活跃用户数作为考核指标。活跃用户数根据不同统计周期可以分为日活跃数(DAU)、周活跃数(WAU)、月活跃数(MAU)。大多数希望用户每天都打开的应用如新闻APP、社交APP、音乐APP等,其产品的KPI考核指标均为日活跃用户数(DAU)。为什么?如果这些APP考核的指标是月活跃用户数,那么会出现什么状况?月活跃用户只要求用户在一个月内启动应用一次既可以计算为月活跃用户,所以,一个本应该每天都要启动的应用,如果用月活跃用户数作为KPI来考核,那么会出现产品运营负责人“偷懒”的情况,产品运营人员只需要每月想办法让用户启动一次即可,也许向用户推送两三个活动就可以实现,这样的考核会导致产品不够吸引力甚至是不健康。如果用日活跃用户来作为KPI来考核这个产品,那么产品运营负责人一定会设计让用户每天都想用的功能或者更新每天用户都想看的内容来吸引用户来使用。
(2)新增用户指标
新增用户是指安装应用后,首次启动应用的用户。按照统计时间跨度不同分为日、周、月新增用户。新增用户量指标主要是衡量营销推广渠道效果的最基础指标;另一方面,新增用户占活跃用户的比例也可以用来用于衡量产品健康度。如果某产品新用户占比过高,那说明该产品的活跃是靠推广得来,这种情况非常值得关注,尤其是关注用户的留存率情况。
(3)用户构成指标
用户构成是对周活跃用户或者月活跃用户的构成进行分析,有助于通过新老用户结构了解活跃用户健康度。以周活跃用户为例,周活跃用户包括以下几类用户,包括本周回流用户、连续活跃n周用户、忠诚用户、连续活跃用户。本周回流用户是指上周未启动过应用,本周启动应用的用户;连续活跃n周用户是指连续n周,每周至少启动过一次应用的活跃用户;忠诚用户是指连续活跃5周及以上的用户;连续活跃用户是指连续活跃2周及以上的用户;近期流失用户是指连续n周(大约等于1周,但小于等于4周)没有启动过应用但用户。
(4)用户留存率指标
用户留存率是指在某一统计时段内的新增用户数中再经过一段时间后仍启动该应用的用户比例。用户留存率可重点关注次日、7日、14日以及30日留存率。次日留存率即某一统计时段(如今天)新增用户在第二天(如明天)再次启动应用的比例;7日留存率即某一统计时段(如今天)新增用户数在第7天再次启动该应用的比例;14日和30日留存率以此类推。用户留存率是验证产品用户吸引力很重要的指标。通常,我们可以利用用户留存率对比同一类别应用中不同应用的用户吸引力。如果对于某一个应用,在相对成熟的版本情况下,如果用户留存率有明显变化,则说明用户质量有明显变化,很可能是因为推广渠道质量的变化所引起的。
(5)每个用户总活跃天数指标
每个用户的总活跃天数指标(TAD,Total Active Days per User)是在统计周期内,平均每个用户在应用的活跃天数。如果统计周期比较长,如统计周期一年以上,那么,每个用户的总活跃天数基本可以反映用户在流失之前在APP上耗费的天数,这是反映用户质量尤其是用户活跃度很重要的指标。
二、参与度分析
参与度分析的常见分析包括启动次数分析、使用时长分析、访问页面分析和使用时间间隔分析。参与度分析主要是分析用户的活跃度。
(1)启动次数指标
启动次数是指在某一统计周期内用户启动应用的次数。在进行数据分析时,一方面要关注启动次数的总量走势,另一方面,则需要关注人均启动次数,即同一统计周期的启动次数与活跃用户数的比值,如人均日启动次数,则为日启动次数与日活跃用户数的比值,反映的是每天每用户平均启动次数。通常,人均启动次数和人均使用时长可以结合一起分析。
(2)使用时长
使用总时长是指在某一统计统计周期内所有从APP启动到结束使用的总计时长。使用时长还可以从人均使用时长、单次使用时长等角度进行分析。人均使用时长是同一统计周期内的使用总时长和活跃用户数的比值;单次使用时长是同一统计周期内使用总时长和启动次数的比值。使用时长相关的指标也是衡量产品活跃度、产品质量的重要指标,道理很简单,用户每天的时间是有限的且宝贵的,如果用户愿意在你的产品投入更多的时间,证明你的应用对用户很重要。启动次数和使用时长可以结合一起分析,如果用户启动次数高,使用时长高,该APP则为用户质量非常高,用户粘性好的应用,比如现在很流行的社交应用。
(3)访问页面
访问页面数指用户一次启动访问的页面数。我们通常要分析访问页面数分布,即统计一定周期内(如1天、7天或30天)应用的访问页面数的活跃用户数分布,如访问1-2页的活跃用户数、3-5页的活跃用户数、6-9页的活跃用户数、10-29页的活跃用户数、30-50页的活跃用户数,以及50页以上的活跃用户数。同时,我们可以通过不同统计周期(但统计跨度相同,如都为7天)的访问页面分布的差异,以便于发现用户体验的问题。
(4)使用时间间隔
使用时间间隔是指同一用户相邻两次启动的时间间隔。我们通常要分析使用时间间隔分布,一般统计一个月内应用的用户使用时间间隔的活跃用户数分布,如使用时间间隔在1一天内、1天、2天……7天、8-14天、15-30天的活跃用户数分布。同时,我们可以通过不同统计周期(但统计跨度相同,如都为30天)的使用时间间隔分布的差异,以便于发现用户体验的问题。
三、渠道分析
渠道分析主要是分析个渠道在相关的渠道质量的变化和趋势,以科学评估渠道质量,优化渠道推广策略。渠道分析需要渠道推广负责人重点关注,尤其是目前移动应用市场渠道作弊较为盛行的情况下,渠道推广的分析尤其是要重点关注渠道作弊的分析。
渠道分析包括新增用户、活跃用户、启动次数、单次使用时长和留存率等指标。这些指标均在上文阐述过,在此就不在赘述。以上提到的只是渠道质量评估的初步维度,如果还需要进一步研究渠道,尤其是研究到渠道防作弊层面,指标还需要更多,包括:判断用户使用行为是否正常的指标,如关键操作活跃量占总活跃的占比,用户激活APP的时间是否正常;判断用户设备是否真实,如机型、操作系统等集中度的分析。
总之,如果要深入研究渠道作弊,算法的核心思想是研究推广渠道所带来的用户是否是真的“人”在用,从这个方向去设计相关的评估指标和算法,如某渠道带来的用户大部分集中在凌晨2点使用APP,我们就认为这种渠道所带来的用户很可能不是正常人在使用,甚至是机器在作弊。
四、功能分析
功能分析主要分析功能活跃情况、页面访问路径以及转化率。这些指标需要功能运营的产品经理重点关注。
(1)功能活跃指标
功能活跃指标主要关注某功能的活跃人数、某功能新增用户数、某功能用户构成、某功能用户留存。这些指标的定义与本文第一部分的“用户规模与质量”的指标类似。只是,本部分只关注某一功能模块,而不是APP整体。
(2)页面访问路径分析
APP页面访问路径统计用户从打开应用到离开应用整个过程钟每一步的页面访问和跳转情况。页面访问路径分析的目的是在达到APP商业目标之下帮助APP用户在使用APP的不同阶段完成任务,并且提高任务完成的效率。APP页面访问路径分析需要考虑以下三方面问题:(a)APP用户身份的多样性,用户可能是你的会员或者潜在会员,有可能是你的同事或者竞争对手等;(b)APP用户目的多样性,不同用户使用APP的目的有所不同;(c)APP用户访问路径的多样性,即时是身份类似、使用目的类似,但访问路径也很可能不同。因此,我们在做APP页面访问路径分析的时候,需要对APP用户做细分,然后再进行APP页面访问路径分析。最常用的细分方法是按照APP的使用目的来进行用户分类,如汽车APP的用户便可以细分为关注型、意向型、购买型用户,并对每类用户进行基于不同访问任务的进行路径分析,比如意向型的用户,他们进行不同车型的比较都有哪些路径,存在什么问题。还有一种方法是利用算法,基于用户所有访问路径进行聚类分析,基于访问路径的相似性对用户进行分类,再对每类用户进行分析。
(3)漏斗模型
漏斗模型是用于分析产品中关键路径的转化率,以确定产品流程的设计是否合理,分析用户体验问题。转化率是指进入下一页面的人数(或页面浏览量)与当前页面的人数(或页面浏览量)的比值。用户从刚进入到完成产品使用的某关键任务时(如购物),不同步骤之间的转换会发生损耗。如用户进入某电商网站,到浏览商品,到把商品放入购物车,最后到支付,每一个环节都有很多的用户流失损耗。通过分析转化率,我们可以比较快定位用户使用产品的不同路径中,那一路径是否存在问题。当然,对于产品经理,其实不用每天都看转化率报表,我们可以对每天的转化率进行连续性的监控,一旦转化率出现较大的波动,便发告警邮件给到相应的产品负责人,以及时发现产品问题。
五、用户属性分析
用户属性分析主要从用户使用的设备终端、网络及运营商分析和用户画像角度进行分析。
(1)设备终端分析
设备终端的分析维度包括机型分析、分辨率分析和操作系统系统分析,在分析的时候,主要针对这些对象进行活跃用户、新增用户数、启动次数的分析。即分析不同机型的活跃用户数、新增用户数和启动次数,分析不同分辨率设备的活跃用户数、新增用户数和启动次数,分析不同操作系统设备的活跃用户数、新增用户数和启动次数。
(2)网络及运营商分析
网络及运营商主要分析用户联网方式和使用的电信运营商,主要针对这些对象进行活跃用户、新增用户数、启动次数的分析。即分析联网方式(包括wifi、2G、3G、4G)的活跃用户数、新增用户数和启动次数,分析不同运营商(中国移动、中国电信、中国联通等)的活跃用户数、新增用户数和启动次数。
(3)地域分析
主要分析不同区域,包括不同省市和国家的活跃用户数、新增用户数和启动次数。
(4)用户画像分析
用户画像分析包括人口统计学特征分析、用户个人兴趣分析、用户商业兴趣分析。人口统计学特征包括性别、年龄、学历、收入、支出、职业、行业等;用户个人兴趣指个人生活兴趣爱好的分析,如听音乐、看电影、健身、养宠物等;用户商业兴趣指房产、汽车、金融等消费领域的兴趣分析。用户画像这部分的数据需要进行相相关的画像数据采集,才可以支撑比较详细的画像分析。
本文主要介绍了APP基础的数据分析体系,还有更多的指标体系需要根据APP的特性进行特殊设计,比如,搜索APP需要关注与其特性相关的指标如搜索关键词数、人均搜索关键词数等。另外,还有一个非常值得关注的是,很多产品经理或者运营人员认为本文提到的很多指标,产品上线后便自然可以看到,这是一个非常常见的误区。因为,本文提到的大多数指标,如果不进行数据打点上报,并进行相关的数据开发统计,就不能看不到相关的数据报表。所以,产品经理在产品上线前一定要规划好自己所负责的产品的数据体系,驱动开发进行相关的数据采集上报,并在运营过程中,动态优化和丰富数据体系。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在 MySQL 实际应用中,“频繁写入同一表” 是常见场景 —— 如实时日志存储(用户操作日志、系统运行日志)、高频交易记录(支付 ...
2025-10-30为帮助教育工作者、研究者科学分析 “班级规模” 与 “平均成绩” 的关联关系,我将从相关系数的核心定义与类型切入,详解 “数 ...
2025-10-30对 CDA(Certified Data Analyst)数据分析师而言,“相关系数” 不是简单的数字计算,而是 “从业务问题出发,量化变量间关联强 ...
2025-10-30在构建前向神经网络(Feedforward Neural Network,简称 FNN)时,“隐藏层数目设多少?每个隐藏层该放多少个神经元?” 是每个 ...
2025-10-29这个问题切中了 Excel 用户的常见困惑 —— 将 “数据可视化工具” 与 “数据挖掘算法” 的功能边界混淆。核心结论是:Excel 透 ...
2025-10-29在 CDA(Certified Data Analyst)数据分析师的工作中,“多组数据差异验证” 是高频需求 —— 例如 “3 家门店的销售额是否有显 ...
2025-10-29在数据分析中,“正态分布” 是许多统计方法(如 t 检验、方差分析、线性回归)的核心假设 —— 数据符合正态分布时,统计检验的 ...
2025-10-28箱线图(Box Plot)作为展示数据分布的核心统计图表,能直观呈现数据的中位数、四分位数、离散程度与异常值,是质量控制、实验分 ...
2025-10-28在 CDA(Certified Data Analyst)数据分析师的工作中,“分类变量关联分析” 是高频需求 —— 例如 “用户性别是否影响支付方式 ...
2025-10-28在数据可视化领域,单一图表往往难以承载多维度信息 —— 力导向图擅长展现节点间的关联结构与空间分布,却无法直观呈现 “流量 ...
2025-10-27这个问题问到了 Tableau 中两个核心行级函数的经典组合,理解它能帮你快速实现 “相对位置占比” 的分析需求。“index ()/size ( ...
2025-10-27对 CDA(Certified Data Analyst)数据分析师而言,“假设检验” 绝非 “套用统计公式的机械操作”,而是 “将模糊的业务猜想转 ...
2025-10-27在数字化运营中,“凭感觉做决策” 早已成为过去式 —— 运营指标作为业务增长的 “晴雨表” 与 “导航仪”,直接决定了运营动作 ...
2025-10-24在卷积神经网络(CNN)的训练中,“卷积层(Conv)后是否添加归一化(如 BN、LN)和激活函数(如 ReLU、GELU)” 是每个开发者都 ...
2025-10-24在数据决策链条中,“统计分析” 是挖掘数据规律的核心,“可视化” 是呈现规律的桥梁 ——CDA(Certified Data Analyst)数据分 ...
2025-10-24在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23在数据分析全流程中,“数据清洗” 恰似烹饪前的食材处理:若食材(数据)腐烂变质、混杂异物(脏数据),即便拥有精湛的烹饪技 ...
2025-10-23在人工智能领域,“大模型” 已成为近年来的热点标签:从参数超 1750 亿的 GPT-3,到万亿级参数的 PaLM,再到多模态大模型 GPT-4 ...
2025-10-22在 MySQL 数据库的日常运维与开发中,“更新数据是否会影响读数据” 是一个高频疑问。这个问题的答案并非简单的 “是” 或 “否 ...
2025-10-22