京公网安备 11010802034615号
经营许可证编号:京B2-20210330
数据分析八大禁忌
大家都对这种东西嗤之以鼻对不对?作为接受过高等教育的我们怎么会信这些命理风水的东西呢,比如床不能对着电视机,开玩笑,老祖宗的年代有电视机吗?躺着看电视才享受呢。对于这种东西,陈老师一开始也是拒绝的,直到有一天半夜起床上厕所,看到电视机里自己的影子以为撞见鬼吓得尿了一裤裆,才深刻感慨祖先智慧的伟大。
所以禁忌这种东西,都是借鬼神之言,行人间之事。特别是面对那些初出茅庐的小伙子,还真的编点鬼怪故事恐吓一下他们的好奇心,才会避免他们走更多弯路,正如每个老奶奶都养了一只吓唬孙子的大灰狼一样。
在数据分析领域,也有这样的行为禁忌,站在支持业务的角度,数据分析工作可分为三类:
1.事前:预测
2.事中:监控
3.事后:评估
我们一类一类看一下,办事的时候有哪些禁忌
事前预测:三类禁忌要牢记,每一个都惹不了
1.忌参合神仙的事:比如那种受政策,规定,环境影响巨大的业务,不可预测,不能预测,也不要去预测。我们是不知道中央什么时候出文件的,也不知道什么时候土地爷爷不爽抖抖膀子,所以此类事件只能归于黑天鹅,效果很难事先预计。话说回来,如果能事先预知,有这么大本事为啥不去炒楼呢,突然好期待!(╯3╰)
2.忌参合皇帝的事:上有神仙下有皇帝,那种受自己公司或者合作方公司的政策,制度,规则影响很大的业务,也不要去预测。因为当一个业务受政策,制度,规则等高层主观能动性影响太大的时候,高层的决策就是唯一关键要素,事件发展只要看老板们决策就好了,完全无法按正常进展去预测。
3.忌参合妖怪的事:上有政策下有对策,在对下游管控力度弱的时候,下游的业务状况就很难按正常的逻辑去预测。最典型性的,就是下游经销商,KA势力强大,公司只能看别人脸色行事。这时候如果下游借公司促销机会钻空子套利,即无法管理,也无法预测事态走向。因为人心之险恶过于妖怪,人性之贪婪是很难预测的。
宜:收集原因数据
预测的本质原理是:过去发生的事情未来会重现,过去发生的原因和未来一样。因此当游戏规则完全不可知或被关键人物掌控的时候,预测就变得毫无意义。相应的,如果规则是市场自发形成的,可观测可追踪的,那么就可以进行预测,其中的关键就是尽可能多的收集原因数据。
举个简单的例子,公司销售额连续8个月上升,那么第9个月会不会上升呢?答案是:不知道。因为连续8个月上升是一个结果,结果不能证明结果,只有找到上游的原因才行。连续增长是因为新产品?渠道发力?促销带动?推广范围?找到原因自然可以根据原因的变化情况,预测未来的结果。这也是预测类分析的铁律:抓住原因找结果。
相应的,因为很多原因是不能收集,或者收集不全的,所以所有的预测都是有概率,有范围的,最好是给出乐观,悲观等几个可能。不在预测的时候立flag,是数据分析师与街头算命张大师的本质区别。
事中监控:理清逻辑再动手,不然下班没法走
忌只给孤立的一个或几个数字:业务方今天要个数字A,后天要个数字B,大后天要个数字C,每一个都得计算百分比/平均值,每一个都得看回过往6个月,每一个数字都是加急,每一个都要插队做,于是天天都在加班跑各种数。这就是典型的没有理清数据与项目间的逻辑,只是孤立的给数据的坏处。
宜:理清数据与项目间逻辑关系
举个栗子:我们有一个促销要针对持有VIP2级会员卡的顾客,在实体店消费指定产品组合2件以上的人奖励一个礼品,通过这个活动拉动整体消费,促进会员卡普及率。那么要看哪些数据呢?
1.从整体效果出发:既然目标是整体消费,就要把总消费当做最大KPI并且拆分到天,每天去追踪效果,既要统计当天达标率,又得计算累计数额,还要和去年对比,全方位让业务掌控整体进度。
2.从过程管理出发:各区域达标率如何?现有会员发动了多少?新会员吸引了多少?有多少只买了1件的漏网之鱼?有多少买了两件却不办会员卡的?这些指标及时给出来,可以帮助业务指导各片区,门店的执行工作。是否有区域出现所有的达标消费都出现在一个门店的怪事?这种明显反常指标提前指出来,可以帮助业务打击渠道作弊行为。
3.从运作出发:产品与礼品的库存都要够。因此每天要看各区域产品组合与礼品库存数,每天消耗数,还要根据每天参与人数,剩余参与人数,参与率三个指标计算预计所需的库存数。
因此报表至少要包含以上三类数十个字段,才可以承接到业务方的需求。这些具体的需求点要事先谈好才行,业务方没有提的要主动提示。要做到这样的清晰,首先业务方得有清晰的目标和考核指标,有清晰的推进方法,这样才能选出用那些字段来描述问题,要做那些推算,生产什么新变量。
如果还没有清晰到上边的程度,欢迎业务部门随时来和分析师交流。我们能帮你理清思路,梳理用哪些字段描述问题;我们也能提供一些过往的项目经验给到你们参考;我们还能指引你看那些平时不咋看的报表,帮你建立概念。总之多聊天,少下不清晰的需求单,对大家都有好处,(*^__^*)
事后评估:四大禁忌要牢记,不帮业务擦屁屁
1.忌找架打:“他的项目就是烂!帮我分析下烂在哪里吧!”“不好意思,没这服务”
2.忌找资源:“我的项目很缺钱!请分析下重要性吧!”“不好意思,没这服务”
3.忌找点赞:“我的项目很优秀!请着重强调下吧!”“不好意思,没这服务”
4.忌找理由:“我的活动没业绩!麻烦分析下闪光点吧!”“不好意思,没这服务”
科学性与严肃性是分析师工作的基本要求。我们只对提供的数据准确性负责任,不对各种项目,工作的结果负责任。我们可以提供必要的数据,但评价是好还是坏,和标杆有关,标杆怎么定,是业务部门需要思考和设计的。分析师可以提建议,但不要直接下结论。我们是为老板决策提供支持的,不是为某个业务条线提供善后服务的,失去了科学性和中立性,我们也会失去老板的信任。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
主讲人简介 张冲,海归统计学硕士,CDA 认证数据分析师,前云南白药集团资深数据分析师,自媒体 Python 讲师,全网课程播放量破 ...
2026-04-10在数据可视化与业务分析中,同比分析是衡量业务发展趋势、识别周期波动的核心手段,其核心逻辑是将当前周期数据与上年同期数据进 ...
2026-04-10在机器学习模型的落地应用中,预测精度并非衡量模型可靠性的唯一标准,不确定性分析同样不可或缺。尤其是在医疗诊断、自动驾驶、 ...
2026-04-10数据本身是沉默的,唯有通过有效的呈现方式,才能让其背后的规律、趋势与价值被看见、被理解、被运用。统计制图(数据可视化)作 ...
2026-04-10在全球化深度发展的今天,跨文化传播已成为连接不同文明、促进多元共生的核心纽带,其研究核心围绕“信息传递、文化解读、意义建 ...
2026-04-09在数据可视化领域,折线图是展示时序数据、趋势变化的核心图表类型之一,其简洁的线条的能够清晰呈现数据的起伏规律。Python ECh ...
2026-04-09在数据驱动的时代,数据分析早已不是“凭经验、靠感觉”的零散操作,而是一套具备固定逻辑、标准化流程的系统方法——这就是数据 ...
2026-04-09长短期记忆网络(LSTM)作为循环神经网络(RNN)的重要改进模型,凭借其独特的门控机制(遗忘门、输入门、输出门),有效解决了 ...
2026-04-08在数据分析全流程中,数据质量是决定分析结论可靠性的核心前提,而异常值作为数据集中的“异类”,往往会干扰统计检验、模型训练 ...
2026-04-08在数字经济飞速发展的今天,数据已渗透到各行各业的核心场景,成为解读趋势、优化决策、创造价值的核心载体。而数据分析,作为挖 ...
2026-04-08在数据分析全流程中,数据处理是基础,图形可视化是核心呈现手段——前者负责将杂乱无章的原始数据转化为干净、规范、可分析的格 ...
2026-04-07在数据分析与统计推断中,p值是衡量假设检验结果显著性的核心指标,其本质是在原假设(通常为“无效应”“无差异”)成立的前提 ...
2026-04-07在数字经济深度渗透的今天,数据已成为企业生存发展的核心资产,企业的竞争本质已转变为数据利用能力的竞争。然而,大量来自生产 ...
2026-04-07Python凭借简洁的语法、丰富的生态库,成为算法开发、数据处理、机器学习等领域的首选语言。但受限于动态类型、解释性执行的特性 ...
2026-04-03在深度学习神经网络中,卷积操作是实现数据特征提取的核心引擎,更是让模型“看懂”数据、“解读”数据的关键所在。不同于传统机 ...
2026-04-03当数字化转型从企业的“战略口号”落地为“生存之战”,越来越多的企业意识到,转型的核心并非技术的堆砌,而是数据价值的深度挖 ...
2026-04-03在日常办公数据分析中,数据透视表凭借高效的汇总、分组功能,成为Excel、WPS等办公软件中最常用的数据分析工具之一。其中,“计 ...
2026-04-02在数字化交互的全场景中,用户的每一次操作都在生成动态的行为轨迹——电商用户的“浏览商品→点击详情→加入购物车”,内容APP ...
2026-04-02在数字化转型深度推进的今天,企业数据已成为驱动业务增长、构建核心竞争力的战略资产,而数据安全则是守护这份资产的“生命线” ...
2026-04-02在数据驱动决策的浪潮中,数据挖掘与数据分析是两个高频出现且极易被混淆的概念。有人将二者等同看待,认为“做数据分析就是做数 ...
2026-04-01