京公网安备 11010802034615号
经营许可证编号:京B2-20210330
数据分析八大禁忌
大家都对这种东西嗤之以鼻对不对?作为接受过高等教育的我们怎么会信这些命理风水的东西呢,比如床不能对着电视机,开玩笑,老祖宗的年代有电视机吗?躺着看电视才享受呢。对于这种东西,陈老师一开始也是拒绝的,直到有一天半夜起床上厕所,看到电视机里自己的影子以为撞见鬼吓得尿了一裤裆,才深刻感慨祖先智慧的伟大。
所以禁忌这种东西,都是借鬼神之言,行人间之事。特别是面对那些初出茅庐的小伙子,还真的编点鬼怪故事恐吓一下他们的好奇心,才会避免他们走更多弯路,正如每个老奶奶都养了一只吓唬孙子的大灰狼一样。
在数据分析领域,也有这样的行为禁忌,站在支持业务的角度,数据分析工作可分为三类:
1.事前:预测
2.事中:监控
3.事后:评估
我们一类一类看一下,办事的时候有哪些禁忌
事前预测:三类禁忌要牢记,每一个都惹不了
1.忌参合神仙的事:比如那种受政策,规定,环境影响巨大的业务,不可预测,不能预测,也不要去预测。我们是不知道中央什么时候出文件的,也不知道什么时候土地爷爷不爽抖抖膀子,所以此类事件只能归于黑天鹅,效果很难事先预计。话说回来,如果能事先预知,有这么大本事为啥不去炒楼呢,突然好期待!(╯3╰)
2.忌参合皇帝的事:上有神仙下有皇帝,那种受自己公司或者合作方公司的政策,制度,规则影响很大的业务,也不要去预测。因为当一个业务受政策,制度,规则等高层主观能动性影响太大的时候,高层的决策就是唯一关键要素,事件发展只要看老板们决策就好了,完全无法按正常进展去预测。
3.忌参合妖怪的事:上有政策下有对策,在对下游管控力度弱的时候,下游的业务状况就很难按正常的逻辑去预测。最典型性的,就是下游经销商,KA势力强大,公司只能看别人脸色行事。这时候如果下游借公司促销机会钻空子套利,即无法管理,也无法预测事态走向。因为人心之险恶过于妖怪,人性之贪婪是很难预测的。
宜:收集原因数据
预测的本质原理是:过去发生的事情未来会重现,过去发生的原因和未来一样。因此当游戏规则完全不可知或被关键人物掌控的时候,预测就变得毫无意义。相应的,如果规则是市场自发形成的,可观测可追踪的,那么就可以进行预测,其中的关键就是尽可能多的收集原因数据。
举个简单的例子,公司销售额连续8个月上升,那么第9个月会不会上升呢?答案是:不知道。因为连续8个月上升是一个结果,结果不能证明结果,只有找到上游的原因才行。连续增长是因为新产品?渠道发力?促销带动?推广范围?找到原因自然可以根据原因的变化情况,预测未来的结果。这也是预测类分析的铁律:抓住原因找结果。
相应的,因为很多原因是不能收集,或者收集不全的,所以所有的预测都是有概率,有范围的,最好是给出乐观,悲观等几个可能。不在预测的时候立flag,是数据分析师与街头算命张大师的本质区别。
事中监控:理清逻辑再动手,不然下班没法走
忌只给孤立的一个或几个数字:业务方今天要个数字A,后天要个数字B,大后天要个数字C,每一个都得计算百分比/平均值,每一个都得看回过往6个月,每一个数字都是加急,每一个都要插队做,于是天天都在加班跑各种数。这就是典型的没有理清数据与项目间的逻辑,只是孤立的给数据的坏处。
宜:理清数据与项目间逻辑关系
举个栗子:我们有一个促销要针对持有VIP2级会员卡的顾客,在实体店消费指定产品组合2件以上的人奖励一个礼品,通过这个活动拉动整体消费,促进会员卡普及率。那么要看哪些数据呢?
1.从整体效果出发:既然目标是整体消费,就要把总消费当做最大KPI并且拆分到天,每天去追踪效果,既要统计当天达标率,又得计算累计数额,还要和去年对比,全方位让业务掌控整体进度。
2.从过程管理出发:各区域达标率如何?现有会员发动了多少?新会员吸引了多少?有多少只买了1件的漏网之鱼?有多少买了两件却不办会员卡的?这些指标及时给出来,可以帮助业务指导各片区,门店的执行工作。是否有区域出现所有的达标消费都出现在一个门店的怪事?这种明显反常指标提前指出来,可以帮助业务打击渠道作弊行为。
3.从运作出发:产品与礼品的库存都要够。因此每天要看各区域产品组合与礼品库存数,每天消耗数,还要根据每天参与人数,剩余参与人数,参与率三个指标计算预计所需的库存数。
因此报表至少要包含以上三类数十个字段,才可以承接到业务方的需求。这些具体的需求点要事先谈好才行,业务方没有提的要主动提示。要做到这样的清晰,首先业务方得有清晰的目标和考核指标,有清晰的推进方法,这样才能选出用那些字段来描述问题,要做那些推算,生产什么新变量。
如果还没有清晰到上边的程度,欢迎业务部门随时来和分析师交流。我们能帮你理清思路,梳理用哪些字段描述问题;我们也能提供一些过往的项目经验给到你们参考;我们还能指引你看那些平时不咋看的报表,帮你建立概念。总之多聊天,少下不清晰的需求单,对大家都有好处,(*^__^*)
事后评估:四大禁忌要牢记,不帮业务擦屁屁
1.忌找架打:“他的项目就是烂!帮我分析下烂在哪里吧!”“不好意思,没这服务”
2.忌找资源:“我的项目很缺钱!请分析下重要性吧!”“不好意思,没这服务”
3.忌找点赞:“我的项目很优秀!请着重强调下吧!”“不好意思,没这服务”
4.忌找理由:“我的活动没业绩!麻烦分析下闪光点吧!”“不好意思,没这服务”
科学性与严肃性是分析师工作的基本要求。我们只对提供的数据准确性负责任,不对各种项目,工作的结果负责任。我们可以提供必要的数据,但评价是好还是坏,和标杆有关,标杆怎么定,是业务部门需要思考和设计的。分析师可以提建议,但不要直接下结论。我们是为老板决策提供支持的,不是为某个业务条线提供善后服务的,失去了科学性和中立性,我们也会失去老板的信任。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据分析、机器学习的实操场景中,聚类分析与主成分分析(PCA)是两种高频使用的统计与数据处理方法。二者常被用于数据预处理 ...
2026-02-24在聚类分析的实操场景中,K-Means算法因其简单高效、易落地的特点,成为处理无监督分类问题的首选工具——无论是用户画像分层、 ...
2026-02-24数字化浪潮下,数据已成为企业核心竞争力,“用数据说话、用数据决策”成为企业发展的核心逻辑。CDA(Certified Data Analyst) ...
2026-02-24CDA一级知识点汇总手册 第五章 业务数据的特征、处理与透视分析考点52:业务数据分析基础考点53:输入和资源需求考点54:业务数 ...
2026-02-23CDA一级知识点汇总手册 第四章 战略与业务数据分析考点43:战略数据分析基础考点44:表格结构数据的使用考点45:输入数据和资源 ...
2026-02-22CDA一级知识点汇总手册 第三章 商业数据分析框架考点27:商业数据分析体系的核心逻辑——BSC五视角框架考点28:战略视角考点29: ...
2026-02-20CDA一级知识点汇总手册 第二章 数据分析方法考点7:基础范式的核心逻辑(本体论与流程化)考点8:分类分析(本体论核心应用)考 ...
2026-02-18第一章:数据分析思维考点1:UVCA时代的特点考点2:数据分析背后的逻辑思维方法论考点3:流程化企业的数据分析需求考点4:企业数 ...
2026-02-16在数据分析、业务决策、科学研究等领域,统计模型是连接原始数据与业务价值的核心工具——它通过对数据的规律提炼、变量关联分析 ...
2026-02-14在SQL查询实操中,SELECT * 与 SELECT 字段1, 字段2,...(指定个别字段)是最常用的两种查询方式。很多开发者在日常开发中,为了 ...
2026-02-14对CDA(Certified Data Analyst)数据分析师而言,数据分析的核心不是孤立解读单个指标数值,而是构建一套科学、完整、贴合业务 ...
2026-02-14在Power BI实操中,函数是实现数据清洗、建模计算、可视化呈现的核心工具——无论是简单的数据筛选、异常值处理,还是复杂的度量 ...
2026-02-13在互联网运营、产品迭代、用户增长等工作中,“留存率”是衡量产品核心价值、用户粘性的核心指标——而次日留存率,作为留存率体 ...
2026-02-13对CDA(Certified Data Analyst)数据分析师而言,指标是贯穿工作全流程的核心载体,更是连接原始数据与业务洞察的关键桥梁。CDA ...
2026-02-13在机器学习建模实操中,“特征选择”是提升模型性能、简化模型复杂度、解读数据逻辑的核心步骤——而随机森林(Random Forest) ...
2026-02-12在MySQL数据查询实操中,按日期分组统计是高频需求——比如统计每日用户登录量、每日订单量、每日销售额,需要按日期分组展示, ...
2026-02-12对CDA(Certified Data Analyst)数据分析师而言,描述性统计是贯穿实操全流程的核心基础,更是从“原始数据”到“初步洞察”的 ...
2026-02-12备考CDA的小伙伴,专属宠粉福利来啦! 不用拼运气抽奖,不用复杂操作,只要转发CDA真题海报到朋友圈集赞,就能免费抱走实用好礼 ...
2026-02-11在数据科学、机器学习实操中,Anaconda是必备工具——它集成了Python解释器、conda包管理器,能快速搭建独立的虚拟环境,便捷安 ...
2026-02-11在Tableau数据可视化实操中,多表连接是高频操作——无论是将“产品表”与“销量表”连接分析产品销量,还是将“用户表”与“消 ...
2026-02-11