
谁能用大数据写出那个神秘的小纸条
前两年有一部叫做《点球成金》的电影非常成功,我是在从香港飞往纽约的飞机上观看的。这部由真实事件改变的影片,讲述了全美职棒大联盟的球队奥克兰绿帽队,在经理比恩的带领下,发挥出了超乎想象的实力,最终以弱胜强的故事。这个故事中的传奇经理比恩,重用了数据分析天才布兰德。通过大量的数据分析,挖掘了一批其貌不扬,但是却能够在球队里各司其职的边缘球员。而这种看似神奇的案例,在大数据时代的背景下是完全可能被复制的。实际上比恩和布兰德所运用的分析手段以及数据量,并没有达到大数据的标准。而促使他们成功的关键,却是他们对于数据的解读和认知。那么在今天我们拥有了难以计数的大数据的情况下,怎样能够复制并超越比恩的成功,就成为了所有企业和所有人成败的关键。
英国有一家十分成功的大数据分析公司叫做OPTA。这家大数据公司从收集及分析英超足球比赛数据开始,几年之间将自己的业务扩展到了NBA、网球、高尔夫等几十项体育项目,覆盖了几乎全球所有的主流体育赛事。以足球为例,OPTA为每场比赛提供超过200项数据的收集以及分析服务。球员在场上的每一次触球、每一次跑动、每一次有意识或无意识的动作,都会被OPTA专业的软件记录下来。假设每一场比赛首发加替补,两队一共出场了25名球员,那么OPTA将为这场比赛提供至少5000项球员数据。算上球队数据,每场比赛OPTA就能为球队经理们提供一个十分庞大的数据量。那么如果球队经理们能够正确地运用这些数据,复制比恩的传奇将成为可能。
在2006年世界杯四分之一决赛的点球决战时刻,德国队的守门员莱曼在阿根廷队球员罚点球之前,接到了来自教练组的一张神秘小纸条。凭借这张小纸条,莱曼精准地预判到了阿根廷队多名球员的罚球方向,并扑出了两名阿根廷队球员的点球。而这个神秘的小纸条,正是运用了数据分析,准确地预测了阿根廷球员的罚球方向及角度。这神秘的小纸条就如同芝麻开门的钥匙,能够将大数据这座大山点石成金。
实际上,我们中国自古就有利用数据来分析并作出预测的实例。三国时期,诸葛亮夜观天象,通过对天文数据的收集及分析,准确地预测出了风向,从而赢得了赤壁之战。这样的例子在中国古代还有很多。虽然诸葛亮、比恩和德国队的教练团队并没有真正地使用大数据,但是他们运用的这种分析方式以及对数据作用的理解,非常值得我们学习。
在这个大数据爆炸的时代,收集数据的方式在日益革新。然而,我们所能获取的数据量,已经远远超过了我们能够分析的上限。依据现有的分析手段以及思考方式,其实根本无法将大数据这座大山整个点石成金。我在美国接触过的所有大数据分析公司所能做的,也不过就是将这山上的微小石子变成金子而已。我们每天面对着2940亿封邮件、200万个帖子,到底能够运用多少?数据的单位已经从TB上升到PB、从PB上升到EB、又从EB上升到了ZB。再向上,还有YB、BB、NB、DB,数据只会随着信息技术的发展不断地爆炸式地增长。
那么问题就是,我们应该用这庞大的数据库来做些什么呢?
这个问题,即使是最尖端的美国信息技术学家也无法准确地给出答案。实际上单从商业来讲,美国管理学大师彼得德鲁克也许给我们指出了一些方向。作为现代管理学之父,德鲁克的思想深深地影响着一代又一代的美国营 销管理专家。在与前Saks Fifth Avenue(萨克斯第五大道精品百货)的营 销顾问John O’Malley(约翰奥麦利)的交流中,他反复提到了德鲁克的思想对于现在商业的深刻影响。我们共同认为,德鲁克的思想,即使放在这个大数据的时代依然是超前的。德鲁克认为不论是B2B还是B2C的商业模式,所有企业都需要清楚地认识到,我们到底在哪一个行业里以及我们到底能够为顾客提供什么?这看似简单的问题,却难倒了全球百分之九十以上的公司。大数据的出现,为我们回答这两个问题提供了工具。
那么有了趁手的工具,我们该怎么去运用呢?
德鲁克的思想贯穿了整个商业社会的所有经济行为,而从这之中延展开的却是对行行业业、对整个社会现象的思考和总结。实际上这种思考和总结与中国优秀的传统思想具有很多暗合之处。我在2014年曾经写过一篇论文,专门探讨了德鲁克的思想与中国传统思想的契合。在文章中我提到,这种人类伟大的智慧,是对于整个人类社会的运行规律的探究。不论是西方亦或是东方的优秀思想,均是沿着对宇宙、社会、人生的规律进行探究。大数据的出现和发展,为整个人类带来的财富远远超越了商业价值。而我们生存在这个大数据时代,想要真正的理解并运用大数据,不去对人类最高的智慧进行探究,是必定无法驾驭这庞大的数据的。
中国传统思想讲格物致知。对大数据的研究分析即是格物。这种格物的层次,已经远远地突破了人类世界发展几千年的总和。那么,对于大数据的应用即是致知。这种致知的程度,也会比大数据出现之前更加准确、细微。然而操作分析大数据的人所拥有的智慧,将是决定这种格物致知是否能够产生最大效用的关键。
格大数据之物,致点石成金之知。笔已经放在这里,只看你能否写出那包藏财富的神秘的小纸条。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在使用 Excel 数据透视表进行多维度数据汇总时,折叠功能是梳理数据层级的核心工具 —— 通过点击 “+/-” 符号可展开明细数据或 ...
2025-09-28在使用 Pandas 处理 CSV、TSV 等文本文件时,“引号” 是最容易引发格式混乱的 “隐形杀手”—— 比如字段中包含逗号(如 “北京 ...
2025-09-28在 CDA(Certified Data Analyst)数据分析师的技能工具箱中,数据查询语言(尤其是 SQL)是最基础、也最核心的 “武器”。无论 ...
2025-09-28Cox 模型时间依赖性检验:原理、方法与实战应用 在生存分析领域,Cox 比例风险模型(Cox Proportional Hazards Model)是分析 “ ...
2025-09-26检测因子类型的影响程度大小:评估标准、实战案例与管控策略 在检测分析领域(如环境监测、食品质量检测、工业产品合规性测试) ...
2025-09-26CDA 数据分析师:以数据库为基石,筑牢数据驱动的 “源头防线” 在数据驱动业务的链条中,“数据从哪里来” 是 CDA(Certified D ...
2025-09-26线性相关点分布的四种基本类型:特征、识别与实战应用 在数据分析与统计学中,“线性相关” 是描述两个数值变量间关联趋势的核心 ...
2025-09-25深度神经网络神经元个数确定指南:从原理到实战的科学路径 在深度神经网络(DNN)的设计中,“神经元个数” 是决定模型性能的关 ...
2025-09-25在企业数字化进程中,不少团队陷入 “指标困境”:仪表盘上堆砌着上百个指标,DAU、转化率、营收等数据实时跳动,却无法回答 “ ...
2025-09-25MySQL 服务器内存碎片:成因、检测与内存持续增长的解决策略 在 MySQL 运维中,“内存持续增长” 是常见且隐蔽的性能隐患 —— ...
2025-09-24人工智能重塑工程质量检测:核心应用、技术路径与实践案例 工程质量检测是保障建筑、市政、交通、水利等基础设施安全的 “最后一 ...
2025-09-24CDA 数据分析师:驾驭通用与场景指标,解锁数据驱动的精准路径 在数据驱动业务的实践中,指标是连接数据与决策的核心载体。但并 ...
2025-09-24在数据驱动的业务迭代中,AB 实验系统(负责验证业务优化效果)与业务系统(负责承载用户交互与核心流程)并非独立存在 —— 前 ...
2025-09-23CDA 业务数据分析:6 步闭环,让数据驱动业务落地 在企业数字化转型中,CDA(Certified Data Analyst)数据分析师的核心价值,并 ...
2025-09-23CDA 数据分析师:以指标为钥,解锁数据驱动价值 在数字化转型的浪潮中,“用数据说话” 已成为企业决策的共识。但数据本身是零散 ...
2025-09-23当 “算法” 成为数据科学、人工智能、业务决策领域的高频词时,一种隐形的认知误区正悄然蔓延 —— 有人将分析结果不佳归咎于 ...
2025-09-22在数据分析、金融计算、工程评估等领域,“平均数” 是描述数据集中趋势最常用的工具之一。但多数人提及 “平均数” 时,默认指 ...
2025-09-22CDA 数据分析师:参数估计助力数据决策的核心力量 在数字化浪潮席卷各行各业的当下,数据已成为驱动业务增长、优化运营效率的核 ...
2025-09-22训练与验证损失骤升:机器学习训练中的异常诊断与解决方案 在机器学习模型训练过程中,“损失曲线” 是反映模型学习状态的核心指 ...
2025-09-19解析 DataHub 与 Kafka:数据生态中两类核心工具的差异与协同 在数字化转型加速的今天,企业对数据的需求已从 “存储” 转向 “ ...
2025-09-19