京公网安备 11010802034615号
经营许可证编号:京B2-20210330
很多小伙伴都计划年后换工作,为了帮助各位学习数据分析的小伙伴们成功拿到offer!本期给大家整理了一些数据分析面试时的高频问题,希望大家积极点赞收藏加关注,一起冲鸭~
1、APP近期上线了一个拉新活动,并在各个渠道进行了推广投放,如何评估活动效果?
【参考答案】
如果要对一个活动效果进行分析,无非是要回答以下3个问题:
(1)活动效果怎么样?要不要继续做?
(2)如果可以继续做,活动的做的好的方面是哪些?问题或者瓶颈环节在哪?
(3)针对问题环节的改进方案是什么?
具体展开来讲,可以从以下几个方面:
(1)活动关键指标达成分析
活动关键核心指标达成情况,比如拉新多少用户,达成多少GMV?ROI如何?
(2)活动关键流程漏斗分析
活动的关键流程是什么?以及各个流程的漏斗分析,定位问题发生的环节。
(3)活动的渠道、用户分析
活动在哪些渠道推送?活动推送给哪些用户?用户画像是啥样的?各渠道用户的质量/ROI如何?
(4)活动策略、节奏分析
活动玩法的裂变效果如何?利益点是否有吸引力?活动整个过程节奏把控如何,前期预热、中期爆发和尾期是否过短/过长,运营应该在何时进行适当干预。
2、业务场景题,如何分析次日留存率下降的问题
【参考答案】
业务问题关键是问对问题,然后才是拆解问题去解决。
(1)两层模型
从用户画像、渠道、产品、行为环节等角度细分,明确到底是哪里的次日留存率下降了
(2)指标拆解
次日留存率 = Σ 次日留存数 / 今日获客人数
(3)原因分析
内部:运营活动、产品变动、技术故障、设计漏洞(如产生可以撸羊毛的设计)
外部:竞品、用户偏好、节假日、社会事件(如产生舆论)
3、谈谈RFM用户模型
【参考答案】
RFM模型是客户关系管理(CRM)中一种被广泛使用的营销模型,它是衡量客户价值和客户创利能力的重要工具和手段。
RFM模型主要通过3个指标来描述一个客户的价值:
✅ 最近一次消费时间(Recency),缩写为R
✅ 消费频次(Frequency),缩写为F
✅ 消费金额(Monetary),缩写为M
在具体的应用中,一般是通过R、F、M这3项值将买家进行分层,卖家可以对不同层级的用户采取不同的营销方式~
利用RFM模型划分用户层级,可以进行客户细分、寻找目标客户:
⭕重要价值客户,RFM都很大,优质客户,需要保持
⭕重要发展客户,低活高购高价值,交易金额和交易次数大,但最近无交易。需要发展
⭕重要保持客户,高活低购高价值,交易金额大贡献度高,且最近有交易。需要重点识别
⭕重要挽留客户,低活低购高价值:交易金额大,潜在的有价值客户,需要挽留、促活。
这一模型的【优点】:
✔能够快速对某段时间内的付费用户做用户分类,响应快速的业务需求;
✔能直观了解用户消费的质量,短时间监控大客户的流失情况,及时做出挽回应对措施;
✔能及时发现新的大客户,比如频次低但额度大的用户。
4、什么是假设检验?
【参考答案】
参数估计和假设检验是统计推断的两个组成部分,它们都是利用样本对总体进行某种推断,但推断的角度不同。
(1)参数估计讨论的是用样本估计总体参数的方法,总体参数μ在估计前是未知的。
(2)而在假设检验中,则是先对μ的值提出一个假设,然后利用样本信息去检验这个假设是否成立。
5、 置信度、置信区间
【参考答案】
置信区间是我们所计算出的变量存在的范围,水平就是我们对于这个数值存在于我们计算出的这个范围的可信程度。
(1)举例来讲,有95%的把握,真正的数值在我们所计算的范围里。在这里,95%是置信水平,而计算出的范围,就是置信区间。
(2)如果置信度为95%, 则抽取100个样本来估计总体的均值,由100个样本所构造的100个区间中,约有95个区间包含总体均值。
6、 扑克牌54张,平均分成2份,求这2份都有2张A的概率
【参考答案】
这个问题可以通过计算概率来解决:
有2张A的概率可以通过组合来计算,即从4张A中选取2张A的组合数除以从54张牌中选取2张的组合数:P(2张A) = C(4, 2) / C(54, 2) 其中,C(n, m)表示从n个元素中选取m个元素的组合数。
我们需要将剩下的52张牌平均分成2份,每份26张。其中,有2张A的概率可以表示为:P(2张A) = P(1份有2张A,另1份没有A) + P(1份没有A,另1份有2张A) 假设第一份有2张A,第二份没有A,那么从剩下的50张牌中选出24张牌来组成第一份,剩下的26张牌自然组成第二份。这种情况的概率为:P(1份有2张A,另1份没有A) = C(4, 2) * C(50, 24) / C(54, 26)
(3)同样的道理,当第一份没有A,第二份有2张A时,这种情况的概率也是:P(1份没有A,另1份有2张A) = C(4, 0) * C(50, 26) / C(54, 26)
(4)最后,将两种情况的概率相加即可得到答案:P(两份都有2张A) = P(1份有2张A,另1份没有A) + P(1份没有A,另1份有2张A)代入计算,即可得到最终的概率。
7、做过AB test吗,谈谈原理?
【参考答案】
ABtest的本质其实是两个总体的假设检验问题。这个测试很多教育机构作业帮、学而思等经常用,用来测试哪些课程组合比较受欢迎等。当我们现在有两种方案,方案A和方案B,我们想要知道哪种方案更好,那我们就要做ABtest,也就是要做假设检验。
✅假设检验的步骤如下:
(1) 根据检验目的,构造原假设和备择假设
(2) 构造检验统计量
(3)给出显著性水平,根据样本数据,计算检验统计量的值.
(4)得出检验的结果,拒绝原假设还是没有充分的理由拒绝原假设
✅AB test具体场景问题:
AB test效果不显著,你该怎么判断这个实验的收益?
AB test中实验组核心指标明显优于对照组,那么这个优化就一定能够上线嘛?
AB test时效果显著,但是全量上线时,效果平平,问题在哪里?
AB test效果不显著时,那么是否可以判断这个实验失败了,没有意义?
一般的AB test场景问题都可以从以下几个理由中得到解释:辛普森悖论、新奇效应、以偏盖全、以全盖偏、正交互斥实验。
8、APP激活量的来源渠道很多,怎样对来源渠道变化大的进行预警?
【参考答案】
(1)如果渠道使用时间较长,认为渠道的app激活量满足一个分布,比较可能是正态分布。求平均值和标准差,对 于今日数值与均值差大于3/2/1个标准差的渠道进行预警。
(2)对于短期的新渠道,直接与均值进行对比。
9、用户刚进来APP的时候会选择属性,怎样在保证有完整用户信息的同时让用户流失减少?
【参考答案】
可以采用技术接受模型(TAM)来分析,影响用户接受选择属性这件事的主要因素有:
(1)感知的有用性(perceived usefulness),反映一个人认为使用一个具体的系统对他工作业绩提高的程度; 感知有用性:文案告知用户选择属性能给用户带来的好处
(2)感知的易用性(perceived ease of use),反映一个人认为容易使用一个具体的系统的程度。
感知易用性: a. 关联用户第三方账号 (如微博),可以冷启动阶段匹配用户更有可能选择的属性,推荐用户选择。b. 交互性做好。
(3)使用者态度:用户对填写信息的态度 a. 这里需要允许用户跳过,后续再提醒用户填写 b. 告知用户填写的信息会受到很好的保护
(4)行为意图:用户使用APP的目的性,难以控制
(5)外部变量:如操作时间、操作环境等,这里难以控制
10、卖玉米如何提高收益?价格提高多少才能获取最大收益?
【参考答案】
根据公式收益 = 单价*销售量,那么我们的策略是提高单位溢价或者提高销量。
(1) 提高单位溢价的方法:
品牌打造获得长期溢价,但缺陷是需要大量前期营销投入;
加工商品占据价值链更多环节,如熟玉米、玉米汁、玉米蛋白粉;
(2)重定位商品,如礼品化等;
价格歧视,根据价格敏感度对不同用户采用不同定价。
销售量=流量x转化率,上述提高单位溢价的方法可能对流量产生影响,也可能对转化率产生影响。
收益 = 单价x流量x转化率,短期内能规模化采用的应该是进行价格歧视,如不同时间、不同商圈的玉米价格不同,采取高定价,然后对价格敏感的用户提供优惠券等。
推荐学习书籍
《CDA一级教材》适合CDA一级考生备考,也适合业务及数据分析岗位的从业者提升自我。完整电子版已上线CDA网校,累计已有10万+在读~

免费加入阅读:https://edu.cda.cn/goods/show/3151?targetId=5147&preview=0
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
数据库中的历史数据,是企业运营过程中沉淀的核心资产——包含用户行为轨迹、业务交易记录、产品迭代日志、市场活动效果等多维度 ...
2026-01-08在电商行业竞争日趋激烈的当下,数据已成为驱动业务增长的核心引擎。电商公司的数据分析师,不仅是数据的“解读官”,更是业务的 ...
2026-01-08在数据驱动决策的链路中,统计制图是CDA(Certified Data Analyst)数据分析师将抽象数据转化为直观洞察的关键载体。不同于普通 ...
2026-01-08在主成分分析(PCA)的学习与实践中,“主成分载荷矩阵”和“成分矩阵”是两个高频出现但极易混淆的核心概念。两者均是主成分分 ...
2026-01-07在教学管理、学生成绩分析场景中,成绩分布图是直观呈现成绩分布规律的核心工具——通过图表能快速看出成绩集中区间、高分/低分 ...
2026-01-07在数据分析师的工作闭环中,数据探索与统计分析是连接原始数据与业务洞察的关键环节。CDA(Certified Data Analyst)作为具备专 ...
2026-01-07在数据处理与可视化场景中,将Python分析后的结果导出为Excel文件是高频需求。而通过设置单元格颜色,能让Excel中的数据更具层次 ...
2026-01-06在企业运营、业务监控、数据分析等场景中,指标波动是常态——无论是日营收的突然下滑、用户活跃度的骤升,还是产品故障率的异常 ...
2026-01-06在数据驱动的建模与分析场景中,“数据决定上限,特征决定下限”已成为行业共识。原始数据经过采集、清洗后,往往难以直接支撑模 ...
2026-01-06在Python文件操作场景中,批量处理文件、遍历目录树是高频需求——无论是统计某文件夹下的文件数量、筛选特定类型文件,还是批量 ...
2026-01-05在神经网络模型训练过程中,开发者最担心的问题之一,莫过于“训练误差突然增大”——前几轮还平稳下降的损失值(Loss),突然在 ...
2026-01-05在数据驱动的业务场景中,“垃圾数据进,垃圾结果出”是永恒的警示。企业收集的数据往往存在缺失、异常、重复、格式混乱等问题, ...
2026-01-05在数字化时代,用户行为数据已成为企业的核心资产之一。从用户打开APP的首次点击,到浏览页面的停留时长,再到最终的购买决策、 ...
2026-01-04在数据分析领域,数据稳定性是衡量数据质量的核心维度之一,直接决定了分析结果的可靠性与决策价值。稳定的数据能反映事物的固有 ...
2026-01-04在CDA(Certified Data Analyst)数据分析师的工作链路中,数据读取是连接原始数据与后续分析的关键桥梁。如果说数据采集是“获 ...
2026-01-04尊敬的考生: 您好! 我们诚挚通知您,CDA Level III 考试大纲将于 2025 年 12 月 31 日实施重大更新,并正式启用,2026年3月考 ...
2025-12-31“字如其人”的传统认知,让不少“手残党”在需要签名的场景中倍感尴尬——商务签约时的签名歪歪扭扭,朋友聚会的签名墙不敢落笔 ...
2025-12-31在多元统计分析的因子分析中,“得分系数”是连接原始观测指标与潜在因子的关键纽带,其核心作用是将多个相关性较高的原始指标, ...
2025-12-31对CDA(Certified Data Analyst)数据分析师而言,高质量的数据是开展后续分析、挖掘业务价值的基础,而数据采集作为数据链路的 ...
2025-12-31在中介效应分析(或路径分析)中,间接效应是衡量“自变量通过中介变量影响因变量”这一间接路径强度与方向的核心指标。不同于直 ...
2025-12-30