京公网安备 11010802034615号
经营许可证编号:京B2-20210330
数据分析八大禁忌
大家都对这种东西嗤之以鼻对不对?作为接受过高等教育的我们怎么会信这些命理风水的东西呢,比如床不能对着电视机,开玩笑,老祖宗的年代有电视机吗?躺着看电视才享受呢。对于这种东西,陈老师一开始也是拒绝的,直到有一天半夜起床上厕所,看到电视机里自己的影子以为撞见鬼吓得尿了一裤裆,才深刻感慨祖先智慧的伟大。
所以禁忌这种东西,都是借鬼神之言,行人间之事。特别是面对那些初出茅庐的小伙子,还真的编点鬼怪故事恐吓一下他们的好奇心,才会避免他们走更多弯路,正如每个老奶奶都养了一只吓唬孙子的大灰狼一样。
在数据分析领域,也有这样的行为禁忌,站在支持业务的角度,数据分析工作可分为三类:
1.事前:预测
2.事中:监控
3.事后:评估
我们一类一类看一下,办事的时候有哪些禁忌
事前预测:三类禁忌要牢记,每一个都惹不了
1.忌参合神仙的事:比如那种受政策,规定,环境影响巨大的业务,不可预测,不能预测,也不要去预测。我们是不知道中央什么时候出文件的,也不知道什么时候土地爷爷不爽抖抖膀子,所以此类事件只能归于黑天鹅,效果很难事先预计。话说回来,如果能事先预知,有这么大本事为啥不去炒楼呢,突然好期待!(╯3╰)
2.忌参合皇帝的事:上有神仙下有皇帝,那种受自己公司或者合作方公司的政策,制度,规则影响很大的业务,也不要去预测。因为当一个业务受政策,制度,规则等高层主观能动性影响太大的时候,高层的决策就是唯一关键要素,事件发展只要看老板们决策就好了,完全无法按正常进展去预测。
3.忌参合妖怪的事:上有政策下有对策,在对下游管控力度弱的时候,下游的业务状况就很难按正常的逻辑去预测。最典型性的,就是下游经销商,KA势力强大,公司只能看别人脸色行事。这时候如果下游借公司促销机会钻空子套利,即无法管理,也无法预测事态走向。因为人心之险恶过于妖怪,人性之贪婪是很难预测的。
宜:收集原因数据
预测的本质原理是:过去发生的事情未来会重现,过去发生的原因和未来一样。因此当游戏规则完全不可知或被关键人物掌控的时候,预测就变得毫无意义。相应的,如果规则是市场自发形成的,可观测可追踪的,那么就可以进行预测,其中的关键就是尽可能多的收集原因数据。
举个简单的例子,公司销售额连续8个月上升,那么第9个月会不会上升呢?答案是:不知道。因为连续8个月上升是一个结果,结果不能证明结果,只有找到上游的原因才行。连续增长是因为新产品?渠道发力?促销带动?推广范围?找到原因自然可以根据原因的变化情况,预测未来的结果。这也是预测类分析的铁律:抓住原因找结果。
相应的,因为很多原因是不能收集,或者收集不全的,所以所有的预测都是有概率,有范围的,最好是给出乐观,悲观等几个可能。不在预测的时候立flag,是数据分析师与街头算命张大师的本质区别。
事中监控:理清逻辑再动手,不然下班没法走
忌只给孤立的一个或几个数字:业务方今天要个数字A,后天要个数字B,大后天要个数字C,每一个都得计算百分比/平均值,每一个都得看回过往6个月,每一个数字都是加急,每一个都要插队做,于是天天都在加班跑各种数。这就是典型的没有理清数据与项目间的逻辑,只是孤立的给数据的坏处。
宜:理清数据与项目间逻辑关系
举个栗子:我们有一个促销要针对持有VIP2级会员卡的顾客,在实体店消费指定产品组合2件以上的人奖励一个礼品,通过这个活动拉动整体消费,促进会员卡普及率。那么要看哪些数据呢?
1.从整体效果出发:既然目标是整体消费,就要把总消费当做最大KPI并且拆分到天,每天去追踪效果,既要统计当天达标率,又得计算累计数额,还要和去年对比,全方位让业务掌控整体进度。
2.从过程管理出发:各区域达标率如何?现有会员发动了多少?新会员吸引了多少?有多少只买了1件的漏网之鱼?有多少买了两件却不办会员卡的?这些指标及时给出来,可以帮助业务指导各片区,门店的执行工作。是否有区域出现所有的达标消费都出现在一个门店的怪事?这种明显反常指标提前指出来,可以帮助业务打击渠道作弊行为。
3.从运作出发:产品与礼品的库存都要够。因此每天要看各区域产品组合与礼品库存数,每天消耗数,还要根据每天参与人数,剩余参与人数,参与率三个指标计算预计所需的库存数。
因此报表至少要包含以上三类数十个字段,才可以承接到业务方的需求。这些具体的需求点要事先谈好才行,业务方没有提的要主动提示。要做到这样的清晰,首先业务方得有清晰的目标和考核指标,有清晰的推进方法,这样才能选出用那些字段来描述问题,要做那些推算,生产什么新变量。
如果还没有清晰到上边的程度,欢迎业务部门随时来和分析师交流。我们能帮你理清思路,梳理用哪些字段描述问题;我们也能提供一些过往的项目经验给到你们参考;我们还能指引你看那些平时不咋看的报表,帮你建立概念。总之多聊天,少下不清晰的需求单,对大家都有好处,(*^__^*)
事后评估:四大禁忌要牢记,不帮业务擦屁屁
1.忌找架打:“他的项目就是烂!帮我分析下烂在哪里吧!”“不好意思,没这服务”
2.忌找资源:“我的项目很缺钱!请分析下重要性吧!”“不好意思,没这服务”
3.忌找点赞:“我的项目很优秀!请着重强调下吧!”“不好意思,没这服务”
4.忌找理由:“我的活动没业绩!麻烦分析下闪光点吧!”“不好意思,没这服务”
科学性与严肃性是分析师工作的基本要求。我们只对提供的数据准确性负责任,不对各种项目,工作的结果负责任。我们可以提供必要的数据,但评价是好还是坏,和标杆有关,标杆怎么定,是业务部门需要思考和设计的。分析师可以提建议,但不要直接下结论。我们是为老板决策提供支持的,不是为某个业务条线提供善后服务的,失去了科学性和中立性,我们也会失去老板的信任。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在 MySQL 实际应用中,“频繁写入同一表” 是常见场景 —— 如实时日志存储(用户操作日志、系统运行日志)、高频交易记录(支付 ...
2025-10-30为帮助教育工作者、研究者科学分析 “班级规模” 与 “平均成绩” 的关联关系,我将从相关系数的核心定义与类型切入,详解 “数 ...
2025-10-30对 CDA(Certified Data Analyst)数据分析师而言,“相关系数” 不是简单的数字计算,而是 “从业务问题出发,量化变量间关联强 ...
2025-10-30在构建前向神经网络(Feedforward Neural Network,简称 FNN)时,“隐藏层数目设多少?每个隐藏层该放多少个神经元?” 是每个 ...
2025-10-29这个问题切中了 Excel 用户的常见困惑 —— 将 “数据可视化工具” 与 “数据挖掘算法” 的功能边界混淆。核心结论是:Excel 透 ...
2025-10-29在 CDA(Certified Data Analyst)数据分析师的工作中,“多组数据差异验证” 是高频需求 —— 例如 “3 家门店的销售额是否有显 ...
2025-10-29在数据分析中,“正态分布” 是许多统计方法(如 t 检验、方差分析、线性回归)的核心假设 —— 数据符合正态分布时,统计检验的 ...
2025-10-28箱线图(Box Plot)作为展示数据分布的核心统计图表,能直观呈现数据的中位数、四分位数、离散程度与异常值,是质量控制、实验分 ...
2025-10-28在 CDA(Certified Data Analyst)数据分析师的工作中,“分类变量关联分析” 是高频需求 —— 例如 “用户性别是否影响支付方式 ...
2025-10-28在数据可视化领域,单一图表往往难以承载多维度信息 —— 力导向图擅长展现节点间的关联结构与空间分布,却无法直观呈现 “流量 ...
2025-10-27这个问题问到了 Tableau 中两个核心行级函数的经典组合,理解它能帮你快速实现 “相对位置占比” 的分析需求。“index ()/size ( ...
2025-10-27对 CDA(Certified Data Analyst)数据分析师而言,“假设检验” 绝非 “套用统计公式的机械操作”,而是 “将模糊的业务猜想转 ...
2025-10-27在数字化运营中,“凭感觉做决策” 早已成为过去式 —— 运营指标作为业务增长的 “晴雨表” 与 “导航仪”,直接决定了运营动作 ...
2025-10-24在卷积神经网络(CNN)的训练中,“卷积层(Conv)后是否添加归一化(如 BN、LN)和激活函数(如 ReLU、GELU)” 是每个开发者都 ...
2025-10-24在数据决策链条中,“统计分析” 是挖掘数据规律的核心,“可视化” 是呈现规律的桥梁 ——CDA(Certified Data Analyst)数据分 ...
2025-10-24在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23在数据分析全流程中,“数据清洗” 恰似烹饪前的食材处理:若食材(数据)腐烂变质、混杂异物(脏数据),即便拥有精湛的烹饪技 ...
2025-10-23在人工智能领域,“大模型” 已成为近年来的热点标签:从参数超 1750 亿的 GPT-3,到万亿级参数的 PaLM,再到多模态大模型 GPT-4 ...
2025-10-22在 MySQL 数据库的日常运维与开发中,“更新数据是否会影响读数据” 是一个高频疑问。这个问题的答案并非简单的 “是” 或 “否 ...
2025-10-22