京公网安备 11010802034615号
经营许可证编号:京B2-20210330
如何透过数据分析,结构化地解决问题
麦肯锡的三条核心工作原则提出:“以假设为前提”“以事实为依据”,并通过“完全的结构化”方法进行验证。在这个解决问题的闭环中,我们可以通过验证,判断假设的问题架构是否合理,是否与环境相吻合。如不吻合,我们便要调整假设,并重新验证,直到看清问题本质为止。
分析数据 建立假设
针对行业、企业数据,以分析框架为基础,思考之后整理出来的资料,就是我们所说的“假设”。如果在假设中,某行业成长趋势处于发展的下行通道,应考虑适当减少该行业的新增投资。而“行业下行通道”其实也是一个假设,如果想采取减少投资的策略,就必须验证假设的真实性,这需要我们更进一步地搜集、分析证据。
比如,某电力工程公司面临的问题是市场占有率太低,因此希望得以提升。很多员工认为:市场占有率低的原因是品牌知名度不够高或价格太高,导致项目难以获取。可事实真的是这样吗?
通过行业分析,我们发现该工程公司的业务主要以项目投标的形式获得。因此,市场占有率可以通过参与投标率和中标率相乘获得,即市场占有率=参与投标率*中标率。
如果想提升市场占有率,可从提升参与投标率和中标率两个方向努力。目前,该公司的参与投标率为50%,中标率为10%,因此市场占有率为5%,看到上面的数字,相信大家从直觉上会认为需要提升中标率是解决问题的关键之一,即解决此问题时所建立的假设。
直觉判断只是依据两个数字的绝对值以及边际效益的概念,而更重要的是看数字相对值。这个问题中的相对值是指与行业平均水平做比较,10%的中标率虽然很低,但如果行业的平均值是6%,这对于公司来说,想要提升这一数值便存在难度。由此可见,行业分析和比较的过程,也就是搜集证据验证假设的过程。
搜集证据 明确目标

搜集证据是为了验证假设的真实性,所以在搜集证据时,绝不能简单地随波逐流,要有的放矢。
搜集证据的第一步是明确目标。一旦开始一项工作,首先要清楚地知道其目的和背景,理解整体状况,从而提高效率,否则就会犯方向性错误。另外,需要明确信息的来源,这样才能提高工作效率。证据搜集的具体方法包括:访谈、问卷、调用企业内部系统数据、查看地区经济数据及网络搜索。
在上一段提到的案例中,某电力工程公司首先要获得全行业的数据,如行业参与投标率以及中标率的平均水平,由此推算出哪一项具有提升的空间。同时,对公司内部的数据进行调研,找到每一个项目组的中标率、中标项目特点及中标优势,包含价格优势、关系优势、技术优势、服务优势、品牌优势。最后,汇总每一个地区与每一个项目组的数据即可。
分析证据的两种方法:分类与图表化

通常情境下,我们可以通过分类对比和证据图表化两种方式来更有效地分析证据。
分类对比 分析证据
最近,网上有一篇文章提到:女性的基因里隐藏着分析大数据的潜力。实际上,女性未必会计算大数据,但都是证据分析的高手,擅长长期追踪一些看似不重要的数据,形成自己的“基准线”和“模式”,一旦这些数据点的模式显示出不同于她所熟悉的基准线,便表示情况反常。
这个能力看似很神奇,其实只要遵循一定的分析方法就可以做到。最初,女性会搜集很多看似毫无关联的数据,将其分类后找到规律,专业地说即通过统计,找到分类数据中的基准,再对比数据与基准的不同点得到结论。
在电力工程公司的案例中,我们将公司内部所有的数据进行对比,如果发现各类项目并没有明显的差异,但有些项目组的中标率很高(比如30%),就表明这并不是公司总体技术和品牌的问题,也不是项目选择的问题。但如果只有一个项目组中标率高,就有可能是特例,需再分析该项目组的价格优势和关系优势。分析数据之后,还需要分别对中标率高和中标率不太理想的项目组进行访谈,找到中标的核心优势及共通方法。通过对比,验证出中标的核心优势和共通方法在怎样的情况下更容易被推广。
在这个项目中,我们通过分析找到了问题的关键:投标书中,技术方案的描述以及讲标中的呈现能力是决定项目成败的核心。事实证明,加强对这两方面的培训便能取得更好的成效。
证据图表化 助力问题分析

人们往往会对通过视觉获取的信息产生记忆,图表恰好能在短时间内传播大量的信息,使呈现结果一目了然。证据图表化的目的并不仅仅是提高理解度,其最终目的是解决问题。绘制图表有助于促进分析,理解所发生的情况,从而找出本质问题。
在进行证据分析时,销售额、销售成本价、边际利润、利润这些种类繁多的数字常常会让人摸不着头脑,而实现了图表化后,便可一目了然,让人过目不忘。
| 年份 | 销售额(亿元) | 完成率 |
| 2015 | 101 | 88% |
| 2014 | 105 | 98% |
| 2013 | 102 | 102% |
| 2012 | 98 | 97% |
| 2011 | 95 | 94% |
| 2010 | 91 | 100% |

证据分析时的图表化
搭建金字塔 实现结构化验证
无论是用五分钟阐述问题,还是细致论述问题的推导过程,每种方法背后的依据都是金字塔结构,在金字塔的每一层级中,都呈现出独立的结论和主张。完成问题金字塔结构搭建时,遵循以下5个步骤会更有效率。
第一步 收集证据并分析之后,将推导出的结论与主张列举在一张纸上。
第二步 将纸上的结论、主张根据主题的类似性做出分类。
第三步 将同一类型的结论、主张按顺序排列。
第四步 通过因果关系分析,找出上下层级,搭建金字塔。
同属一类的结论之间通常存在因果关系,在整理时,首先需找到因果关系对应,再将作为原因的结论放在下面,作为结果的结论放在上面,以此搭建金字塔的纵向结构。然后,把在同一层级中的结论按逻辑顺序进行排列,例如:某些项目属并列关系,则根据时间(过去、现在、未来)、数字大小(营业额大小等)、地区(从北到南)、重要性(战略、流程)等排序,进行横向结构展开。
第五步 重复以上步骤,直到所有的结论都出现在金字塔结构中为止。
在按此步骤操作之后,需要进行二次确认,可运用自上而下提问回答的方式进行补充,判断思考的维度是否完整。同时,在得出的因果关联中,也要通过自下而上归纳总结的方法判断结论是否具备充足的理由,且该理由是否可以归纳产生新的结论。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据分析与建模中,“显性特征”(如用户年龄、订单金额、商品类别)是直接可获取的基础数据,但真正驱动业务突破的往往是 “ ...
2025-11-07在大模型(LLM)商业化落地过程中,“结果稳定性” 是比 “单次输出质量” 更关键的指标 —— 对客服对话而言,相同问题需给出一 ...
2025-11-07在数据驱动与合规监管双重压力下,企业数据安全已从 “技术防护” 升级为 “战略刚需”—— 既要应对《个人信息保护法》《数据安 ...
2025-11-07在机器学习领域,“分类模型” 是解决 “类别预测” 问题的核心工具 —— 从 “垃圾邮件识别(是 / 否)” 到 “疾病诊断(良性 ...
2025-11-06在数据分析中,面对 “性别与购物偏好”“年龄段与消费频次”“职业与 APP 使用习惯” 这类成对的分类变量,我们常常需要回答: ...
2025-11-06在 CDA(Certified Data Analyst)数据分析师的工作中,“可解释性建模” 与 “业务规则提取” 是核心需求 —— 例如 “预测用户 ...
2025-11-06在分类变量关联分析中(如 “吸烟与肺癌的关系”“性别与疾病发病率的关联”),卡方检验 P 值与 OR 值(比值比,Odds Ratio)是 ...
2025-11-05CDA 数据分析师的核心价值,不在于复杂的模型公式,而在于将数据转化为可落地的商业行动。脱离业务场景的分析只是 “纸上谈兵” ...
2025-11-05教材入口:https://edu.cda.cn/goods/show/3151 “纲举目张,执本末从。” 若想在数据分析领域有所收获,一套合适的学习教材至 ...
2025-11-05教材入口:https://edu.cda.cn/goods/show/3151 “纲举目张,执本末从。” 若想在数据分析领域有所收获,一套合适的学习教材至 ...
2025-11-04【2025最新版】CDA考试教材:CDA教材一级:商业数据分析(2025)__商业数据分析_cda教材_考试教材 (cdaglobal.com) ...
2025-11-04在数字化时代,数据挖掘不再是实验室里的技术探索,而是驱动商业决策的核心能力 —— 它能从海量数据中挖掘出 “降低成本、提升 ...
2025-11-04在 DDPM(Denoising Diffusion Probabilistic Models)训练过程中,开发者最常困惑的问题莫过于:“我的模型 loss 降到多少才算 ...
2025-11-04在 CDA(Certified Data Analyst)数据分析师的工作中,“无监督样本分组” 是高频需求 —— 例如 “将用户按行为特征分为高价值 ...
2025-11-04当沃尔玛数据分析师首次发现 “啤酒与尿布” 的高频共现规律时,他们揭开了数据挖掘最迷人的面纱 —— 那些隐藏在消费行为背后 ...
2025-11-03这个问题精准切中了配对样本统计检验的核心差异点,理解二者区别是避免统计方法误用的关键。核心结论是:stats.ttest_rel(配对 ...
2025-11-03在 CDA(Certified Data Analyst)数据分析师的工作中,“高维数据的潜在规律挖掘” 是进阶需求 —— 例如用户行为包含 “浏览次 ...
2025-11-03在 MySQL 数据查询中,“按顺序计数” 是高频需求 —— 例如 “统计近 7 天每日订单量”“按用户 ID 顺序展示消费记录”“按产品 ...
2025-10-31在数据分析中,“累计百分比” 是衡量 “部分与整体关系” 的核心指标 —— 它通过 “逐步累加的占比”,直观呈现数据的分布特征 ...
2025-10-31在 CDA(Certified Data Analyst)数据分析师的工作中,“二分类预测” 是高频需求 —— 例如 “预测用户是否会流失”“判断客户 ...
2025-10-31