
从经验思维到实证思维的转变
比起“大数据”,我更喜欢“数据科学”的提法,这是因为:第一,在今后的分享中,我会更偏向于从技术层面探讨如何利用数据优化管理决策;第二,数据量的大小固然重要,然而数据能否提升管理水平,更取决于管理者能否从经验思维转变为科学思维,或者更确切地说,转变为实证思维。所以我想在这管理学家的领地上多谈谈科学。
中国人多以经验思维为主,其特点是判断多而论证少。即便有论证,也是基于逻辑的辩证多,基于数据的实证少。只要留意一下每天的新闻,就会发现经验思维的例子比比皆是。拿一条新闻 “北京中秋前进入最堵一周” 来说,媒体的普遍判断是中秋前堵车是因为人们节前纷纷跑到北京去送礼。这一判断符合我们的经验,似乎也符合逻辑,但是却恰恰缺乏实证。若从实证的角度验证这一判断,我们要回答以下两个问题:为什么说这是最堵的一周?如何证明这最堵的一周是由人们从外地到北京送礼造成的?
要从实证的角度来回答第一个问题,首先要确定“堵”的衡量方式,比如说是以平均车速,或者平均车流量;“平均”又是在哪些时段上,哪些地区内,针对哪些车型(是否包括公交车)。然后,我们需要足够多年份的每周“堵车”数据来支持我们的说法。最后,我们还需要收集尽可能多的控制变量数据,譬如每年中秋与国庆的间隔天数、天气状况、重要会议及活动、道路施工情况、北京的拥车情况、街道面积、高速里程、地铁线路演变等等,因为这些因素都有可能影响堵车并影响我们对“中秋前是最堵一周”的证明。
可见,要从数据科学的角度很好地回答第一个问题并不容易,而要实证地回答第二个问题就更困难了。我们需要知道:每周有多少外地车辆进北京?是否中秋前的一周外地车最多?这些外地车辆是不是来送礼的?来送礼的外地车辆都在什么时间,什么地点出现?当他们出现时,是否直接观测到了拥堵?如果没有直接观测到来送礼的外地车辆造成了拥堵,是否是本地车辆为了避开这些来送礼的外地车造成了其他时间,其他地点的拥堵?
从实证的角度做了这番思考,我们会发现,一个凭经验得出的判断竟然如此难以证明。其实,如果我们尝试用数据科学的方法论来审视一下我们在管理中所做的判断,我们同样会吃惊于很多判断极度缺乏实证依据。而这种将经验思维转变为实证思维所带来的阵痛与震撼,却是我们通向数据科学时代,通向数据驱动的管理决策必经的关键一步。
这种从经验思维到实证思维的转变,不仅是管理观念的转变,还会带来操作层面和技术层面上的转变。从对“北京中秋前进入最堵一周”的实证思考,我们实际上也对哪些数据会有用,哪些数据需要进一步收集,数据分析中哪些因素需要得到控制等等,有了更清晰的认识。并且,在对收集到的数据进一步做实证分析的过程中,我们的原有认识有可能会被颠覆,从而成为展开新一轮实证思考和数据收集的起点。比如说,通过对各主要路口的监控视频进行分析,我们可能并没有发现外来车辆的增加,但是却发现本地公车牌照的出现频率比往常要高。如果有这样的发现,我们对拥堵成因的判断就要修正,进一步的数据收集重点也会随之转到公车使用上了。
尤为重要的是,从经验思维到实证思维的转变,还能帮助我们找到更为高效和低成本的解决方案。还是拿堵车作为例子,基于经验思维的判断,往往会导致兴师动众、社会成本很高的解决方案,譬如限制外来车辆入京。而基于数据和实证分析的解决方案可能会是提高某些时段,某些区域内的停车费用;或是调节相应时段区域内的左转和右转限制及红绿灯的间隔等。相比之下,这样做的成本要小很多。
一直在用堵车说事,这看似只是政府公共管理的范畴,但其实解决堵车问题对企业的运营和营销也会有影响。中秋节大家都要吃月饼,而这些年来,哈根达斯冰淇淋月饼已经成为一线城市中月饼的新宠儿。在促进哈根达斯月饼成功的因素中,其团队运用实证思维来解决堵车问题也功不可没。一开始,团队选在离高速公路出口很近的地点建立临时月饼领取点。从经验思维的角度,这似乎很有道理,因为方便了消费者。但是团队很快发现这样做导致了交通阻塞,不仅降低了顾客的满意度,也招来了政府交通部门的抱怨。之后其团队从实证思维的角度,通过对顾客流量的时间空间分布的分析,优化了领取点的设置、产品配送和领取流程。顾客的体验和忠诚度自然也提升了。
令人高兴的是,实证思维和基于数据的管理决策观念正慢慢地深入人心。大家可能注意到临近中秋时,不少网友吐槽“五仁月饼”难吃,并将其炒成了一个热门话题。然而媒体朋友们并非人云亦云,而是通过问卷调查、销量统计的方法为“五仁月饼”正了名。据9月18日《新京报》报道,消费者对五仁月饼评价排名第二,销量良好,甚至部分店铺都脱销了。媒体需要这样的实证思维,企业管理者也需要这样的实证思维。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
基于 Python response.text 的科技新闻数据清洗去噪实践 在通过 Python requests 库的 response.text 获取 API 数据后,原始数据 ...
2025-08-21基于 Python response.text 的科技新闻综述 在 Python 网络爬虫与 API 调用场景中,response.text 是 requests 库发起请求后获取 ...
2025-08-21数据治理新浪潮:CDA 数据分析师的战略价值与驱动逻辑 一、数据治理的多维驱动引擎 在数字经济与人工智能深度融合的时代,数据治 ...
2025-08-21Power BI 热力地图制作指南:从数据准备到实战分析 在数据可视化领域,热力地图凭借 “直观呈现数据密度与分布趋势” 的核心优势 ...
2025-08-20PyTorch 矩阵运算加速库:从原理到实践的全面解析 在深度学习领域,矩阵运算堪称 “计算基石”。无论是卷积神经网络(CNN)中的 ...
2025-08-20数据建模:CDA 数据分析师的核心驱动力 在数字经济浪潮中,数据已成为企业决策的核心资产。CDA(Certified Data Analyst)数据分 ...
2025-08-20KS 曲线不光滑:模型评估的隐形陷阱,从原因到破局的全指南 在分类模型(如风控违约预测、电商用户流失预警、医疗疾病诊断)的评 ...
2025-08-20偏态分布:揭开数据背后的非对称真相,赋能精准决策 在数据分析的世界里,“正态分布” 常被视为 “理想模型”—— 数据围绕均值 ...
2025-08-19CDA 数据分析师:数字化时代的价值创造者与决策智囊 在数据洪流席卷全球的今天,“数据驱动” 已从企业战略口号落地为核心 ...
2025-08-19CDA 数据分析师:善用 Power BI 索引列,提升数据处理与分析效率 在 Power BI 数据分析流程中,“数据准备” 是决定后续分析质量 ...
2025-08-18CDA 数据分析师:巧用 SQL 多个聚合函数,解锁数据多维洞察 在企业数据分析场景中,单一维度的统计(如 “总销售额”“用户总数 ...
2025-08-18CDA 数据分析师:驾驭表格结构数据的核心角色与实践应用 在企业日常数据存储与分析场景中,表格结构数据(如 Excel 表格、数据库 ...
2025-08-18PowerBI 累计曲线制作指南:从 DAX 度量到可视化落地 在业务数据分析中,“累计趋势” 是衡量业务进展的核心视角 —— 无论是 “ ...
2025-08-15Python 函数 return 多个数据:用法、实例与实战技巧 在 Python 编程中,函数是代码复用与逻辑封装的核心载体。多数场景下,我们 ...
2025-08-15CDA 数据分析师:引领商业数据分析体系构建,筑牢企业数据驱动根基 在数字化转型深化的今天,企业对数据的依赖已从 “零散分析” ...
2025-08-15随机森林中特征重要性(Feature Importance)排名解析 在机器学习领域,随机森林因其出色的预测性能和对高维数据的适应性,被广 ...
2025-08-14t 统计量为负数时的分布计算方法与解析 在统计学假设检验中,t 统计量是常用的重要指标,其分布特征直接影响着检验结果的判断。 ...
2025-08-14CDA 数据分析师与业务数据分析步骤 在当今数据驱动的商业世界中,数据分析已成为企业决策和发展的核心驱动力。CDA 数据分析师作 ...
2025-08-14前台流量与后台流量:数据链路中的双重镜像 在商业数据分析体系中,流量数据是洞察用户行为与系统效能的核心依据。前台流量与 ...
2025-08-13商业数据分析体系构建与 CDA 数据分析师的协同赋能 在企业数字化转型的浪潮中,商业数据分析已从 “可选工具” 升级为 “核 ...
2025-08-13