京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据业已成为管理界的时尚元素。在这方面,NBA可谓大数据的鼻祖,同时也是大数据的最好践行者。
美国职业篮球联赛(NBA)从1980年代起,就开始使用数据管理技术,所有球员得分、篮板、助攻、盖帽、抢断、失误、犯规等一系列场上数据均被统计在列。NBA详实而细致的数据统计,不仅可以提供单个球员的查询工作,还可以对比两名球员,包括两人对位攻防时的表现,比如詹姆斯场均能得28分,科比为27分,但当两人相遇时,科比场均能得到30分,詹姆斯只有24分。
经过近30年的积累和完善,NBA的数据统计和管理更为成熟丰富,还能提供包括场上效率、得分区域等分析。比如2012年席卷NBA的华裔运动员林书豪,在爆发期间一直被专家诟病的一点就是失误太多。这正是来自强大的数据统计,他的助攻失误比仅为2.0,也就是说每送出两个助攻就要伴随一次失误,而顶级后卫保罗的助攻失误比为4.6,超出林书豪一倍,显然更为出色。
数据统计还发现,詹姆斯在篮筐的左侧运球时,多选择投篮,而当他位于篮筐右侧时,进攻方式则主要为突破上篮。这样的数据统计就告诉防守者,当詹姆斯位于篮筐左侧时,可以选择紧身贴防他,封住他投篮即可,因为他不会从左侧突破;而当詹姆斯来到篮筐右侧时,则不能贴身紧逼,这样容易被他一步过掉甩在身后,这时好的防守者都会选择远离詹姆斯两步,因为他不会选择跳投,无需留有封盖的选择,空出足够的距离,反而能防备他突破。
本赛季NBA西区决赛,金州勇士队后卫库里的三分球几乎让对手马刺队无解。马刺队更换了几乎所有可能的球员防守库里,但效果均不理想,其中帕克防守库里让对手13投9中,换吉诺比利防守让对方9投7中,莱昂纳德更是让对手16投12中。也许是无人可换,马刺队使用了不善于防守的格林,数据统计居然显示库里的投篮命中率为13投1中。这让马刺队主帅波波维奇在随后的比赛中大胆启用格林,并一举赢得比赛。
关于姚明,NBA也有周密的数据分析,比如统计他在篮下接球运球失误的次数比得出结论,姚明右手接球时通常能运球三次,左手接球则只能运球两次。这样的统计规律告诉防守人,要想解除姚明对篮下的威胁,就要把他限制在远离篮筐的区域,让他必须运球三次以上才能来到篮下,这样他往往就要失误。
在NBA,休斯敦火箭队总经理莫雷是数据分析的专家。这位学习计算机科学的麻省理工高材生,利用一套同步数据录入技术,能得到最新最全的NBA技术统计。一家在西雅图、西考克斯、纽约和卢森堡分别设有数据中心并使用卫星技术的专业公司会将每场NBA比赛的所有细节以最快的速度呈现在莫雷面前,包括数据以及和数据有关的录像。“你能看得一个球员职业生涯的所有得分和运球。”这家公司的CEO、前太阳队录像分析师加里克·巴尔说,“只要你想要的,在NBA赛场上发生过的,我们都能提供。”
这种数据分析,不只给出结果,还包括比赛运行过程。“比如突入禁区这种行为会给比赛带来怎样的影响,如果不突破呢?”莫雷说,“另外,还要考虑到持球者的因素,阿尔斯通会有多大几率选择投篮,结果怎样?有多大几率传球?或者是造犯规?还是失误了?如果换着麦蒂持球,情况又会发生怎样的变化?”
作为联盟数据分析的鼻祖,莫雷在担任火箭总经理期间,先是参与了巴蒂尔的交易,后又换来斯科拉,选来布鲁克斯、兰德里等人,还用极小的代价换来阿泰斯特,帮助球队闯过季后赛首轮,又用兰德里和麦蒂的大合同换来实力型选手选手马丁和潜力球员希尔,其运作能力屡屡受到媒体好评,这离不开数据分析的功劳。
莫雷说:“如果你正在考虑交易阿泰斯特,那你就看看增加一个阿泰斯特之后球队会出现怎样的变化。他的投篮命中率是多少,与阵容中其他球员组合时,效果会怎样?比如当他在内线向外传球的时候,球队的进攻得分几率是多少?他在左翼和右翼进攻的比例,还有,当他在干拔跳投和跳起传球之间选择时给球队带来怎样的不同?”
根据对联盟各支球队的调查,30支球队中其中有15支聘请了至少一位球队数据分析师,他们将在比赛日上、选秀大会上和交易决定上提出重要的建议。而且,联盟中的顶尖球队都是自己专门的数据分析师,包括六大分区榜首球队,魔术和小牛都雇有专职数据分析师,常驻球队。数据分析对于球队战绩的影响也已体现。在花精力进行数据分析的15支球队里,他们的平均胜率达到59.3%,而没有进行分析工作的球队则只有40.7%的平均胜率。
数据的科学就在于,也许一次比赛是偶然发挥,但如果把大量的比赛汇总,基本能反应一名球员的全面状况。当然,如此丰富的数据统计,自然需要大量的人力、物力投入。以湖人队为例,他们的首席录像分析师克里斯·博达肯和助手的办公室就位于主教练杰克逊的旁边,办公桌上摆有8台数字录像机,5台笔记本电脑和18台刻录机。两个人要为湖人教练和球员准备一切他们可能需要的录像资料。比如科比就喜欢看他的防守人的比赛集锦。每场比赛前,录像师都会用搜集好科比对手前几场比赛的资料,做成大约8到12分钟的光盘,交给他。科比还不会只要一名球员的录像,凡是他有可能防守的对象,他都会让录像师剪辑一段出来。“这是比赛计划。”科比说,“上场以后,你得确保对手的每个动作你都见过。每个人都有自己的比赛习惯。”在NBA的球员里,科比是最迷比赛录像的球员之一。在NBA赛季中,他会随身携带一部便携式DVD,十英寸大的屏幕,科比在赛前赛后只要有时间,就会时不时地盯紧屏幕,看录像贯穿了他的整个比赛准备活动。
不过,莫雷坦陈,数据虽然准确,但也冰冷、呆板。“数据分析工作中最难的方面是,我们无法决定,一个球员在受到队友的影响下,会变得如何。”莫雷说,“我们试图通过数据分析向球员展现,最有效的比赛方式是怎样的。但如果球员们无法在赛场上有效地执行出这样的打法,那也没有用。这时就是教练该介入的时候了,教练须有开放的头脑,肯倾听我们的意见,但他也知道什么时候该忽略我们。”
这也是森林狼总经理大卫·卡恩的直言,“詹姆斯离开了骑士,给骑士10000万个数据分析师都没用。”即球队实力是最重要的,但做好数据分析能帮助球队倒是不假。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在 MySQL 实际应用中,“频繁写入同一表” 是常见场景 —— 如实时日志存储(用户操作日志、系统运行日志)、高频交易记录(支付 ...
2025-10-30为帮助教育工作者、研究者科学分析 “班级规模” 与 “平均成绩” 的关联关系,我将从相关系数的核心定义与类型切入,详解 “数 ...
2025-10-30对 CDA(Certified Data Analyst)数据分析师而言,“相关系数” 不是简单的数字计算,而是 “从业务问题出发,量化变量间关联强 ...
2025-10-30在构建前向神经网络(Feedforward Neural Network,简称 FNN)时,“隐藏层数目设多少?每个隐藏层该放多少个神经元?” 是每个 ...
2025-10-29这个问题切中了 Excel 用户的常见困惑 —— 将 “数据可视化工具” 与 “数据挖掘算法” 的功能边界混淆。核心结论是:Excel 透 ...
2025-10-29在 CDA(Certified Data Analyst)数据分析师的工作中,“多组数据差异验证” 是高频需求 —— 例如 “3 家门店的销售额是否有显 ...
2025-10-29在数据分析中,“正态分布” 是许多统计方法(如 t 检验、方差分析、线性回归)的核心假设 —— 数据符合正态分布时,统计检验的 ...
2025-10-28箱线图(Box Plot)作为展示数据分布的核心统计图表,能直观呈现数据的中位数、四分位数、离散程度与异常值,是质量控制、实验分 ...
2025-10-28在 CDA(Certified Data Analyst)数据分析师的工作中,“分类变量关联分析” 是高频需求 —— 例如 “用户性别是否影响支付方式 ...
2025-10-28在数据可视化领域,单一图表往往难以承载多维度信息 —— 力导向图擅长展现节点间的关联结构与空间分布,却无法直观呈现 “流量 ...
2025-10-27这个问题问到了 Tableau 中两个核心行级函数的经典组合,理解它能帮你快速实现 “相对位置占比” 的分析需求。“index ()/size ( ...
2025-10-27对 CDA(Certified Data Analyst)数据分析师而言,“假设检验” 绝非 “套用统计公式的机械操作”,而是 “将模糊的业务猜想转 ...
2025-10-27在数字化运营中,“凭感觉做决策” 早已成为过去式 —— 运营指标作为业务增长的 “晴雨表” 与 “导航仪”,直接决定了运营动作 ...
2025-10-24在卷积神经网络(CNN)的训练中,“卷积层(Conv)后是否添加归一化(如 BN、LN)和激活函数(如 ReLU、GELU)” 是每个开发者都 ...
2025-10-24在数据决策链条中,“统计分析” 是挖掘数据规律的核心,“可视化” 是呈现规律的桥梁 ——CDA(Certified Data Analyst)数据分 ...
2025-10-24在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23在数据分析全流程中,“数据清洗” 恰似烹饪前的食材处理:若食材(数据)腐烂变质、混杂异物(脏数据),即便拥有精湛的烹饪技 ...
2025-10-23在人工智能领域,“大模型” 已成为近年来的热点标签:从参数超 1750 亿的 GPT-3,到万亿级参数的 PaLM,再到多模态大模型 GPT-4 ...
2025-10-22在 MySQL 数据库的日常运维与开发中,“更新数据是否会影响读数据” 是一个高频疑问。这个问题的答案并非简单的 “是” 或 “否 ...
2025-10-22