
很多小伙伴都计划年后换工作,为了帮助各位学习数据分析的小伙伴们成功拿到offer!本期给大家整理了一些数据分析面试时的高频问题,希望大家积极点赞收藏加关注,一起冲鸭~
1、APP近期上线了一个拉新活动,并在各个渠道进行了推广投放,如何评估活动效果?
【参考答案】
如果要对一个活动效果进行分析,无非是要回答以下3个问题:
(1)活动效果怎么样?要不要继续做?
(2)如果可以继续做,活动的做的好的方面是哪些?问题或者瓶颈环节在哪?
(3)针对问题环节的改进方案是什么?
具体展开来讲,可以从以下几个方面:
(1)活动关键指标达成分析
活动关键核心指标达成情况,比如拉新多少用户,达成多少GMV?ROI如何?
(2)活动关键流程漏斗分析
活动的关键流程是什么?以及各个流程的漏斗分析,定位问题发生的环节。
(3)活动的渠道、用户分析
活动在哪些渠道推送?活动推送给哪些用户?用户画像是啥样的?各渠道用户的质量/ROI如何?
(4)活动策略、节奏分析
活动玩法的裂变效果如何?利益点是否有吸引力?活动整个过程节奏把控如何,前期预热、中期爆发和尾期是否过短/过长,运营应该在何时进行适当干预。
2、业务场景题,如何分析次日留存率下降的问题
【参考答案】
业务问题关键是问对问题,然后才是拆解问题去解决。
(1)两层模型
从用户画像、渠道、产品、行为环节等角度细分,明确到底是哪里的次日留存率下降了
(2)指标拆解
次日留存率 = Σ 次日留存数 / 今日获客人数
(3)原因分析
内部:运营活动、产品变动、技术故障、设计漏洞(如产生可以撸羊毛的设计)
外部:竞品、用户偏好、节假日、社会事件(如产生舆论)
3、谈谈RFM用户模型
【参考答案】
RFM模型是客户关系管理(CRM)中一种被广泛使用的营销模型,它是衡量客户价值和客户创利能力的重要工具和手段。
RFM模型主要通过3个指标来描述一个客户的价值:
✅ 最近一次消费时间(Recency),缩写为R
✅ 消费频次(Frequency),缩写为F
✅ 消费金额(Monetary),缩写为M
在具体的应用中,一般是通过R、F、M这3项值将买家进行分层,卖家可以对不同层级的用户采取不同的营销方式~
利用RFM模型划分用户层级,可以进行客户细分、寻找目标客户:
⭕重要价值客户,RFM都很大,优质客户,需要保持
⭕重要发展客户,低活高购高价值,交易金额和交易次数大,但最近无交易。需要发展
⭕重要保持客户,高活低购高价值,交易金额大贡献度高,且最近有交易。需要重点识别
⭕重要挽留客户,低活低购高价值:交易金额大,潜在的有价值客户,需要挽留、促活。
这一模型的【优点】:
✔能够快速对某段时间内的付费用户做用户分类,响应快速的业务需求;
✔能直观了解用户消费的质量,短时间监控大客户的流失情况,及时做出挽回应对措施;
✔能及时发现新的大客户,比如频次低但额度大的用户。
4、什么是假设检验?
【参考答案】
参数估计和假设检验是统计推断的两个组成部分,它们都是利用样本对总体进行某种推断,但推断的角度不同。
(1)参数估计讨论的是用样本估计总体参数的方法,总体参数μ在估计前是未知的。
(2)而在假设检验中,则是先对μ的值提出一个假设,然后利用样本信息去检验这个假设是否成立。
5、 置信度、置信区间
【参考答案】
置信区间是我们所计算出的变量存在的范围,水平就是我们对于这个数值存在于我们计算出的这个范围的可信程度。
(1)举例来讲,有95%的把握,真正的数值在我们所计算的范围里。在这里,95%是置信水平,而计算出的范围,就是置信区间。
(2)如果置信度为95%, 则抽取100个样本来估计总体的均值,由100个样本所构造的100个区间中,约有95个区间包含总体均值。
6、 扑克牌54张,平均分成2份,求这2份都有2张A的概率
【参考答案】
这个问题可以通过计算概率来解决:
有2张A的概率可以通过组合来计算,即从4张A中选取2张A的组合数除以从54张牌中选取2张的组合数:P(2张A) = C(4, 2) / C(54, 2) 其中,C(n, m)表示从n个元素中选取m个元素的组合数。
我们需要将剩下的52张牌平均分成2份,每份26张。其中,有2张A的概率可以表示为:P(2张A) = P(1份有2张A,另1份没有A) + P(1份没有A,另1份有2张A) 假设第一份有2张A,第二份没有A,那么从剩下的50张牌中选出24张牌来组成第一份,剩下的26张牌自然组成第二份。这种情况的概率为:P(1份有2张A,另1份没有A) = C(4, 2) * C(50, 24) / C(54, 26)
(3)同样的道理,当第一份没有A,第二份有2张A时,这种情况的概率也是:P(1份没有A,另1份有2张A) = C(4, 0) * C(50, 26) / C(54, 26)
(4)最后,将两种情况的概率相加即可得到答案:P(两份都有2张A) = P(1份有2张A,另1份没有A) + P(1份没有A,另1份有2张A)代入计算,即可得到最终的概率。
7、做过AB test吗,谈谈原理?
【参考答案】
ABtest的本质其实是两个总体的假设检验问题。这个测试很多教育机构作业帮、学而思等经常用,用来测试哪些课程组合比较受欢迎等。当我们现在有两种方案,方案A和方案B,我们想要知道哪种方案更好,那我们就要做ABtest,也就是要做假设检验。
✅假设检验的步骤如下:
(1) 根据检验目的,构造原假设和备择假设
(2) 构造检验统计量
(3)给出显著性水平,根据样本数据,计算检验统计量的值.
(4)得出检验的结果,拒绝原假设还是没有充分的理由拒绝原假设
✅AB test具体场景问题:
AB test效果不显著,你该怎么判断这个实验的收益?
AB test中实验组核心指标明显优于对照组,那么这个优化就一定能够上线嘛?
AB test时效果显著,但是全量上线时,效果平平,问题在哪里?
AB test效果不显著时,那么是否可以判断这个实验失败了,没有意义?
一般的AB test场景问题都可以从以下几个理由中得到解释:辛普森悖论、新奇效应、以偏盖全、以全盖偏、正交互斥实验。
8、APP激活量的来源渠道很多,怎样对来源渠道变化大的进行预警?
【参考答案】
(1)如果渠道使用时间较长,认为渠道的app激活量满足一个分布,比较可能是正态分布。求平均值和标准差,对 于今日数值与均值差大于3/2/1个标准差的渠道进行预警。
(2)对于短期的新渠道,直接与均值进行对比。
9、用户刚进来APP的时候会选择属性,怎样在保证有完整用户信息的同时让用户流失减少?
【参考答案】
可以采用技术接受模型(TAM)来分析,影响用户接受选择属性这件事的主要因素有:
(1)感知的有用性(perceived usefulness),反映一个人认为使用一个具体的系统对他工作业绩提高的程度; 感知有用性:文案告知用户选择属性能给用户带来的好处
(2)感知的易用性(perceived ease of use),反映一个人认为容易使用一个具体的系统的程度。
感知易用性: a. 关联用户第三方账号 (如微博),可以冷启动阶段匹配用户更有可能选择的属性,推荐用户选择。b. 交互性做好。
(3)使用者态度:用户对填写信息的态度 a. 这里需要允许用户跳过,后续再提醒用户填写 b. 告知用户填写的信息会受到很好的保护
(4)行为意图:用户使用APP的目的性,难以控制
(5)外部变量:如操作时间、操作环境等,这里难以控制
10、卖玉米如何提高收益?价格提高多少才能获取最大收益?
【参考答案】
根据公式收益 = 单价*销售量,那么我们的策略是提高单位溢价或者提高销量。
(1) 提高单位溢价的方法:
品牌打造获得长期溢价,但缺陷是需要大量前期营销投入;
加工商品占据价值链更多环节,如熟玉米、玉米汁、玉米蛋白粉;
(2)重定位商品,如礼品化等;
价格歧视,根据价格敏感度对不同用户采用不同定价。
销售量=流量x转化率,上述提高单位溢价的方法可能对流量产生影响,也可能对转化率产生影响。
收益 = 单价x流量x转化率,短期内能规模化采用的应该是进行价格歧视,如不同时间、不同商圈的玉米价格不同,采取高定价,然后对价格敏感的用户提供优惠券等。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
PowerBI 累计曲线制作指南:从 DAX 度量到可视化落地 在业务数据分析中,“累计趋势” 是衡量业务进展的核心视角 —— 无论是 “ ...
2025-08-15Python 函数 return 多个数据:用法、实例与实战技巧 在 Python 编程中,函数是代码复用与逻辑封装的核心载体。多数场景下,我们 ...
2025-08-15CDA 数据分析师:引领商业数据分析体系构建,筑牢企业数据驱动根基 在数字化转型深化的今天,企业对数据的依赖已从 “零散分析” ...
2025-08-15随机森林中特征重要性(Feature Importance)排名解析 在机器学习领域,随机森林因其出色的预测性能和对高维数据的适应性,被广 ...
2025-08-14t 统计量为负数时的分布计算方法与解析 在统计学假设检验中,t 统计量是常用的重要指标,其分布特征直接影响着检验结果的判断。 ...
2025-08-14CDA 数据分析师与业务数据分析步骤 在当今数据驱动的商业世界中,数据分析已成为企业决策和发展的核心驱动力。CDA 数据分析师作 ...
2025-08-14前台流量与后台流量:数据链路中的双重镜像 在商业数据分析体系中,流量数据是洞察用户行为与系统效能的核心依据。前台流量与 ...
2025-08-13商业数据分析体系构建与 CDA 数据分析师的协同赋能 在企业数字化转型的浪潮中,商业数据分析已从 “可选工具” 升级为 “核 ...
2025-08-13解析 CDA 数据分析师:数据时代的价值挖掘者 在数字经济高速发展的今天,数据已成为企业核心资产,而将数据转化为商业价值的 ...
2025-08-13解析 response.text 与 response.content 的核心区别 在网络数据请求与处理的场景中,开发者经常需要从服务器返回的响应中提取数 ...
2025-08-12MySQL 统计连续每天数据:从业务需求到技术实现 在数据分析场景中,连续日期的数据统计是衡量业务连续性的重要手段 —— 无论是 ...
2025-08-12PyTorch 中 Shuffle 机制:数据打乱的艺术与实践 在深度学习模型训练过程中,数据的呈现顺序往往对模型性能有着微妙却关键的影响 ...
2025-08-12Pandas 多列条件筛选:从基础语法到实战应用 在数据分析工作中,基于多列条件筛选数据是高频需求。无论是提取满足特定业务规则的 ...
2025-08-12人工智能重塑 CDA 数据分析领域:从工具革新到能力重构 在数字经济浪潮与人工智能技术共振的 2025 年,数据分析行业正经历着前所 ...
2025-08-12游戏流水衰退率:计算方法与实践意义 在游戏行业中,流水(即游戏收入)是衡量一款游戏商业表现的核心指标之一。而游戏流水衰退 ...
2025-08-12CDA 一级:数据分析入门的基石 在当今数据驱动的时代,数据分析能力已成为职场中的一项重要技能。CDA(Certified Data Anal ...
2025-08-12破解游戏用户流失困局:从数据洞察到留存策略 在游戏行业竞争白热化的当下,用户流失率已成为衡量产品健康度的核心指标。一款游 ...
2025-08-11数据时代的黄金入场券:CDA 认证解锁职业新蓝海 一、万亿级市场需求下的数据分析人才缺口 在数字化转型浪潮中,数据已成为企业核 ...
2025-08-11DBeaver 实战:实现两个库表结构同步的高效路径 在数据库管理与开发工作中,保持不同环境(如开发库与生产库、主库与从库)的表 ...
2025-08-08t 检验与卡方检验:数据分析中的两大统计利器 在数据分析领域,统计检验是验证假设、挖掘数据规律的重要手段。其中,t 检验和卡 ...
2025-08-08