
从经验思维到实证思维的转变
比起“大数据”,我更喜欢“数据科学”的提法,这是因为:第一,在今后的分享中,我会更偏向于从技术层面探讨如何利用数据优化管理决策;第二,数据量的大小固然重要,然而数据能否提升管理水平,更取决于管理者能否从经验思维转变为科学思维,或者更确切地说,转变为实证思维。所以我想在这管理学家的领地上多谈谈科学。
中国人多以经验思维为主,其特点是判断多而论证少。即便有论证,也是基于逻辑的辩证多,基于数据的实证少。只要留意一下每天的新闻,就会发现经验思维的例子比比皆是。拿一条新闻 “北京中秋前进入最堵一周” 来说,媒体的普遍判断是中秋前堵车是因为人们节前纷纷跑到北京去送礼。这一判断符合我们的经验,似乎也符合逻辑,但是却恰恰缺乏实证。若从实证的角度验证这一判断,我们要回答以下两个问题:为什么说这是最堵的一周?如何证明这最堵的一周是由人们从外地到北京送礼造成的?
要从实证的角度来回答第一个问题,首先要确定“堵”的衡量方式,比如说是以平均车速,或者平均车流量;“平均”又是在哪些时段上,哪些地区内,针对哪些车型(是否包括公交车)。然后,我们需要足够多年份的每周“堵车”数据来支持我们的说法。最后,我们还需要收集尽可能多的控制变量数据,譬如每年中秋与国庆的间隔天数、天气状况、重要会议及活动、道路施工情况、北京的拥车情况、街道面积、高速里程、地铁线路演变等等,因为这些因素都有可能影响堵车并影响我们对“中秋前是最堵一周”的证明。
可见,要从数据科学的角度很好地回答第一个问题并不容易,而要实证地回答第二个问题就更困难了。我们需要知道:每周有多少外地车辆进北京?是否中秋前的一周外地车最多?这些外地车辆是不是来送礼的?来送礼的外地车辆都在什么时间,什么地点出现?当他们出现时,是否直接观测到了拥堵?如果没有直接观测到来送礼的外地车辆造成了拥堵,是否是本地车辆为了避开这些来送礼的外地车造成了其他时间,其他地点的拥堵?
从实证的角度做了这番思考,我们会发现,一个凭经验得出的判断竟然如此难以证明。其实,如果我们尝试用数据科学的方法论来审视一下我们在管理中所做的判断,我们同样会吃惊于很多判断极度缺乏实证依据。而这种将经验思维转变为实证思维所带来的阵痛与震撼,却是我们通向数据科学时代,通向数据驱动的管理决策必经的关键一步。
这种从经验思维到实证思维的转变,不仅是管理观念的转变,还会带来操作层面和技术层面上的转变。从对“北京中秋前进入最堵一周”的实证思考,我们实际上也对哪些数据会有用,哪些数据需要进一步收集,数据分析中哪些因素需要得到控制等等,有了更清晰的认识。并且,在对收集到的数据进一步做实证分析的过程中,我们的原有认识有可能会被颠覆,从而成为展开新一轮实证思考和数据收集的起点。比如说,通过对各主要路口的监控视频进行分析,我们可能并没有发现外来车辆的增加,但是却发现本地公车牌照的出现频率比往常要高。如果有这样的发现,我们对拥堵成因的判断就要修正,进一步的数据收集重点也会随之转到公车使用上了。
尤为重要的是,从经验思维到实证思维的转变,还能帮助我们找到更为高效和低成本的解决方案。还是拿堵车作为例子,基于经验思维的判断,往往会导致兴师动众、社会成本很高的解决方案,譬如限制外来车辆入京。而基于数据和实证分析的解决方案可能会是提高某些时段,某些区域内的停车费用;或是调节相应时段区域内的左转和右转限制及红绿灯的间隔等。相比之下,这样做的成本要小很多。
一直在用堵车说事,这看似只是政府公共管理的范畴,但其实解决堵车问题对企业的运营和营销也会有影响。中秋节大家都要吃月饼,而这些年来,哈根达斯冰淇淋月饼已经成为一线城市中月饼的新宠儿。在促进哈根达斯月饼成功的因素中,其团队运用实证思维来解决堵车问题也功不可没。一开始,团队选在离高速公路出口很近的地点建立临时月饼领取点。从经验思维的角度,这似乎很有道理,因为方便了消费者。但是团队很快发现这样做导致了交通阻塞,不仅降低了顾客的满意度,也招来了政府交通部门的抱怨。之后其团队从实证思维的角度,通过对顾客流量的时间空间分布的分析,优化了领取点的设置、产品配送和领取流程。顾客的体验和忠诚度自然也提升了。
令人高兴的是,实证思维和基于数据的管理决策观念正慢慢地深入人心。大家可能注意到临近中秋时,不少网友吐槽“五仁月饼”难吃,并将其炒成了一个热门话题。然而媒体朋友们并非人云亦云,而是通过问卷调查、销量统计的方法为“五仁月饼”正了名。据9月18日《新京报》报道,消费者对五仁月饼评价排名第二,销量良好,甚至部分店铺都脱销了。媒体需要这样的实证思维,企业管理者也需要这样的实证思维。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
Pandas 选取特定值所在行:6 类核心方法与实战指南 在使用 pandas 处理结构化数据时,“选取特定值所在的行” 是最高频的操作之 ...
2025-09-30球面卷积神经网络(SCNN) 为解决这一痛点,球面卷积神经网络(Spherical Convolutional Neural Network, SCNN) 应运而生。它通 ...
2025-09-30在企业日常运营中,“未来会怎样” 是决策者最关心的问题 —— 电商平台想知道 “下月销量能否达标”,金融机构想预判 “下周股 ...
2025-09-30Excel 能做聚类分析吗?基础方法、进阶技巧与场景边界 在数据分析领域,聚类分析是 “无监督学习” 的核心技术 —— 无需预设分 ...
2025-09-29XGBoost 决策树:原理、优化与工业级实战指南 在机器学习领域,决策树因 “可解释性强、处理非线性关系能力突出” 成为基础模型 ...
2025-09-29在标签体系的落地链路中,“设计标签逻辑” 只是第一步,真正让标签从 “纸上定义” 变为 “业务可用资产” 的关键,在于标签加 ...
2025-09-29在使用 Excel 数据透视表进行多维度数据汇总时,折叠功能是梳理数据层级的核心工具 —— 通过点击 “+/-” 符号可展开明细数据或 ...
2025-09-28在使用 Pandas 处理 CSV、TSV 等文本文件时,“引号” 是最容易引发格式混乱的 “隐形杀手”—— 比如字段中包含逗号(如 “北京 ...
2025-09-28在 CDA(Certified Data Analyst)数据分析师的技能工具箱中,数据查询语言(尤其是 SQL)是最基础、也最核心的 “武器”。无论 ...
2025-09-28Cox 模型时间依赖性检验:原理、方法与实战应用 在生存分析领域,Cox 比例风险模型(Cox Proportional Hazards Model)是分析 “ ...
2025-09-26检测因子类型的影响程度大小:评估标准、实战案例与管控策略 在检测分析领域(如环境监测、食品质量检测、工业产品合规性测试) ...
2025-09-26CDA 数据分析师:以数据库为基石,筑牢数据驱动的 “源头防线” 在数据驱动业务的链条中,“数据从哪里来” 是 CDA(Certified D ...
2025-09-26线性相关点分布的四种基本类型:特征、识别与实战应用 在数据分析与统计学中,“线性相关” 是描述两个数值变量间关联趋势的核心 ...
2025-09-25深度神经网络神经元个数确定指南:从原理到实战的科学路径 在深度神经网络(DNN)的设计中,“神经元个数” 是决定模型性能的关 ...
2025-09-25在企业数字化进程中,不少团队陷入 “指标困境”:仪表盘上堆砌着上百个指标,DAU、转化率、营收等数据实时跳动,却无法回答 “ ...
2025-09-25MySQL 服务器内存碎片:成因、检测与内存持续增长的解决策略 在 MySQL 运维中,“内存持续增长” 是常见且隐蔽的性能隐患 —— ...
2025-09-24人工智能重塑工程质量检测:核心应用、技术路径与实践案例 工程质量检测是保障建筑、市政、交通、水利等基础设施安全的 “最后一 ...
2025-09-24CDA 数据分析师:驾驭通用与场景指标,解锁数据驱动的精准路径 在数据驱动业务的实践中,指标是连接数据与决策的核心载体。但并 ...
2025-09-24在数据驱动的业务迭代中,AB 实验系统(负责验证业务优化效果)与业务系统(负责承载用户交互与核心流程)并非独立存在 —— 前 ...
2025-09-23CDA 业务数据分析:6 步闭环,让数据驱动业务落地 在企业数字化转型中,CDA(Certified Data Analyst)数据分析师的核心价值,并 ...
2025-09-23