京公网安备 11010802034615号
经营许可证编号:京B2-20210330
关于数据分析思路的4点心得
1.看数据的纬度
在对一款产品或者一款产品的其中的一个模块进行分析时,我们可以从两个大纬度去分析数据。
首先是从广阔的视角先去查看数据,这里需要对该产品所处的行业数据有一个清晰的了解,该产品所处的行业自己所处的市场占有率的排名,一般市场占有率指的是用户的占有量,一般从行业报告可以看出大概的数据。
然后接下来需要分析这款产品的总的数据情况,比如下载量、DAU、WAU、MAU等,以及该产品的最核心的数据是什么,并且如何有可能从侧面去了解这款产品的竞品的相关数据是什么。
当了解完以上这些总体的信息,我们心中应该对自己所负责的产品有了一个宏观的概念,自己在行业内所处的位置,以及现在最需要提升哪些数据指标都有了一个清晰的认识。接下来就可以从大纬度切入到小纬度,进一步去分析一些细节的数据。例如重要的数据信息,包括用户的基本的构成信息,每个模块自己建立的漏斗信息等。一般在做分析的时候应该注意的是数据的异常现象,出现局部的极值(包括极大值和极小值)都需要进行分析。
2.什么才是好的数据指标?
在做数据分析的过程中,我们需要了解什么样的数据才是好数据,如果单纯地去看一个数据是没有太大意义的,数据本身也具有相应的欺骗性,比如从运营同学那得到了日新增用户数1W,那么单纯看这个数据没有什么意义,我们可以说这个数据很好,因为看上去很大,但是你可能没有看到同期的数据,有可能昨天的数据达到了2W。
第一,好的数据一定是首先最好是以比率的形式存在的,不要绝对数,要相对数据。
比如上面的那个数据我们换成增长率,换成环比这个数据,我们就可以进一步的了解到这个数据的好坏。
第二,就是通过对比来判断数据的好坏。
我们将数据的日增长量做成一个折线图,从折线图我们就能看出这个数据是在高点还是在低点。通过对比,我们就会得知这个数据所处的位置是什么样的。另外,通过对比不同的渠道,对比不同的版本,对比不同的用户群等不同纬度的数据,都可以从侧面反映出这个数据的真实情况。
第三,数据不是一成不变的情况,要动态的去看数据。
单纯只看一个点的数据情况是没有意义的,我们要在数据中加入时间的纬度。引入一段单位的时间去看待数据整体的变化趋势,这样才能更为客观的判断产品的健康程度。
3.发现数据异常后将从几个纬度去分析?
有时候从总量的角度是无法洞察出一些问题的。比如在某段时间内,下载量出现了下跌,我们需要去找到这个当中问题出现在哪里。从总量的角度看,安卓的渠道要比IOS的总量大很多,这并不能说明问题。那么我们首先需要将时间的纬度引入到当中,将这几个月纬度的数据进行对比,一定可以看到在安卓当中有一个月份的数值相比其他较低。然后我们再去看这个月份的情况。一般情况下,在找到这个异常会先从渠道的角度去分析,查看是哪个渠道发生了异常的现象。在针对性的去对渠道进行优化。
然后我们还可以从版本的角度去分析,去查看最近近期是否有新版本的更新,如果有新版本的更新,是否设置了新的功能出现了BUG等问题无法解决,导致了用户出现卸载应用的情况。当然这些角度都要加入时间的纬度去判断。
另外,数据异常也不一定是坏事情。比如在分析用户行为的过程中,如果发现了某些类别的用户的关键指标表现良好,那么就一定要分析为什么这些用户的数据表现为什么十分良好,这也是增长黑客的分析思路。比如在facebook早期发现,如果一名用户在刚使用产品的早期可以快速添加10明好友以上的用户,这类的用户的活跃程度就明显高于其他的用户。在比如airbnb在早期发现那些放置的照片十分精美的住家的出租率较好,发现了这个特性后,内部产品技术团队又进行了一次AB测试,发现果然是存在这样的优化点。
所以在早期一个关键的指标就是如何能快速提高用户添加其他好友的数量。这里需要我们从底层数据分析当中要注意对用户进行分层的处理,从不同的纬度分层找到数据异常的族群,找到共性,归纳表现良好的用户的共性,然后将其作为优化的指标进行优化。
4.不同阶段制定的关键指标应该随着产品的阶段性变化发生变化的
在做数据分析的之前,需要我们对我们分析的目标进行确认,每个阶段的目标也存在着不同的目标,是为了增强用户粘性,还是为了提升营收,或者是为了提高病毒传播系数。
比如在对渠道的判断中,不能只关心拉过来的新用户量,最重要的是我们要关心这些新拉过来的用户对产品的关键指标的影响,比如在社区产品,相比新进用户的数量更应该关心这些用户的活跃度,发布帖子的数量,点赞的数量等关键指标。换句话说更应该关注的是漏斗模型最下方的那个量,关注转化率的最底层的那个数据。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在 MySQL 实际应用中,“频繁写入同一表” 是常见场景 —— 如实时日志存储(用户操作日志、系统运行日志)、高频交易记录(支付 ...
2025-10-30为帮助教育工作者、研究者科学分析 “班级规模” 与 “平均成绩” 的关联关系,我将从相关系数的核心定义与类型切入,详解 “数 ...
2025-10-30对 CDA(Certified Data Analyst)数据分析师而言,“相关系数” 不是简单的数字计算,而是 “从业务问题出发,量化变量间关联强 ...
2025-10-30在构建前向神经网络(Feedforward Neural Network,简称 FNN)时,“隐藏层数目设多少?每个隐藏层该放多少个神经元?” 是每个 ...
2025-10-29这个问题切中了 Excel 用户的常见困惑 —— 将 “数据可视化工具” 与 “数据挖掘算法” 的功能边界混淆。核心结论是:Excel 透 ...
2025-10-29在 CDA(Certified Data Analyst)数据分析师的工作中,“多组数据差异验证” 是高频需求 —— 例如 “3 家门店的销售额是否有显 ...
2025-10-29在数据分析中,“正态分布” 是许多统计方法(如 t 检验、方差分析、线性回归)的核心假设 —— 数据符合正态分布时,统计检验的 ...
2025-10-28箱线图(Box Plot)作为展示数据分布的核心统计图表,能直观呈现数据的中位数、四分位数、离散程度与异常值,是质量控制、实验分 ...
2025-10-28在 CDA(Certified Data Analyst)数据分析师的工作中,“分类变量关联分析” 是高频需求 —— 例如 “用户性别是否影响支付方式 ...
2025-10-28在数据可视化领域,单一图表往往难以承载多维度信息 —— 力导向图擅长展现节点间的关联结构与空间分布,却无法直观呈现 “流量 ...
2025-10-27这个问题问到了 Tableau 中两个核心行级函数的经典组合,理解它能帮你快速实现 “相对位置占比” 的分析需求。“index ()/size ( ...
2025-10-27对 CDA(Certified Data Analyst)数据分析师而言,“假设检验” 绝非 “套用统计公式的机械操作”,而是 “将模糊的业务猜想转 ...
2025-10-27在数字化运营中,“凭感觉做决策” 早已成为过去式 —— 运营指标作为业务增长的 “晴雨表” 与 “导航仪”,直接决定了运营动作 ...
2025-10-24在卷积神经网络(CNN)的训练中,“卷积层(Conv)后是否添加归一化(如 BN、LN)和激活函数(如 ReLU、GELU)” 是每个开发者都 ...
2025-10-24在数据决策链条中,“统计分析” 是挖掘数据规律的核心,“可视化” 是呈现规律的桥梁 ——CDA(Certified Data Analyst)数据分 ...
2025-10-24在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23在数据分析全流程中,“数据清洗” 恰似烹饪前的食材处理:若食材(数据)腐烂变质、混杂异物(脏数据),即便拥有精湛的烹饪技 ...
2025-10-23在人工智能领域,“大模型” 已成为近年来的热点标签:从参数超 1750 亿的 GPT-3,到万亿级参数的 PaLM,再到多模态大模型 GPT-4 ...
2025-10-22在 MySQL 数据库的日常运维与开发中,“更新数据是否会影响读数据” 是一个高频疑问。这个问题的答案并非简单的 “是” 或 “否 ...
2025-10-22