京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据如何引发职业体育的大变革_数据分析师
电影《点球成金》告诉我们,数据科学家能解决球队老板用钱解决不了的问题:打造一支冠军球队。“这并不奇怪”,哈佛大学定量社会科学研究院的主任Gary King说,“如果你总结一下那些数据分析能够起到巨大作用的行业的特点,你就会发现,职业体育行业基本具备了这些特点,这也就是为什么数据分析在职业体育中具有如此重要的作用的原因。”文中所说职业体育的特点就是可定量,而大数据则是通过定量的数据比对,来找到解决问题的方法。这一点对于世界第一运动的足球尤为重要。
大数据分析好的联赛标准
大数据是有能力帮助提升一个联赛的水平。2004年创立的中超,只是模仿英超取个名字,可是水平不怎么样,但差在什么地方,要从哪些方面来看提升,好像没有太明确的方向。当方向不确定的时候,出现笑话也就再所难免,我们在追求足球风格时,曾经提出了一个莫须有的“欧洲拉丁派”,甚至提出要锻炼 “叉腰肌”,而大数据时代则大不同了。
以前,关于足球的数据统计只有角球、任意球、红黄牌和射门次数,大数据时代,联赛水平的体现有了许多直观的参数,如跑动距离、有效比赛时间、移动轨迹、控球时间、传球次数等等。以跑动距离、有效比赛时间作比即可一分高下,2010年国际足联的相关统计,职业足球运动员全场跑动距离平均为10000米,中超球员为7000米左右;有效比赛时间,2011年中超的实际有效时间为场均49分03秒,韩国联赛为56分09秒,欧冠联赛场均比赛有效时间为62分39秒。
再从大数据的角度来看,2012年和2013年的中超平均跑动距离都是超过万米;有效时间,2012年超过50分钟,2014年的目标是60分钟,中超的水平确实有了提升,要不也不会有场均1.8万人的现场观众,好歹也是亚洲第一,世界第十。
一个联赛的水平,不光体现在竞技水平上,还会体现在对媒体、对球迷的服务上,从这个方面再看大数据对已经高度职业化的NBA的帮助。NBA官方网站之前有内部的统计工具,只有一些授权的媒体可以使用做一些高级的深入数据分析,2012年,NBA与数据分析解决方案公司合作,NBA从得分、进攻、防守、做球等几大类统计了多达90多项技术指标,数据公司帮助处理NBA高达4500万亿条分割的统计数据。
所以到当2013年圣诞节时,NBA可以很快地告诉一个球迷从1947年开始NBA圣诞节特别节目开始,他喜欢的球队多少次出现在圣诞节比赛中。解说员经常会说“第三节时科比和奥尼尔合起来得分超过55分,湖人队没有输过”之类的话语,一边说一边可能感谢万能的大数据。
大数据指导训练
联赛水平的根基在于日常训练,这一点大家应该没有什么疑义。但这一切没有在大数据时,训练更多地是从精神层面来要求,比如“女排精神”“三从一大”(从难、从严、从实战出发,大运动量),这种口号好提但是具体怎么做却无从下手。
当年流行于中国的12分钟体测,之前一直说是提高运动员的体能,到最后足协官员也承认“无氧耐力法测试的是一种精神力量”。
正是由于训练中长期缺乏数据,尤其是大数据的指导,才会只沦落到精神层面为主导。现在训练中应用大数据的例子,在足球发达国家例子已经很多了,而这两年中超的球队也在注重训练中大数据的使用,广州恒大、山东鲁能、江苏舜天等等。
新浪体育是这么介绍,山东鲁能采用的GPSports系统:
这套高科技系统对队员们在训练中的心率、速度,距离,加速度和减速度等指标进行记录、分析和监控,监控队员的训练量是否达到或超过相应的指标,同时,也能预防队员在训练中出现的伤病。通过科学的训练方法,对队员们训练提高和预防伤病起到很大的作用。
不知道当年被称为“亚洲第一前锋”的郝海东,足协体测困难户,多次面临拿不到上岗证的他,现在了解到这种基于大数据的训练方法会作何感想?
中超的球队普遍是今年刚用上这些设备,可能还没有来得及享受到大数据的好处,英超球队埃弗顿、英格兰主力鲁尼的老东家这个方面有发言权,他们是这么评价大数据的作用:
我们用GPS和心率测量仪来监测每个球员的状态。从体能的角度来说,最显著的数据是冲刺数量、冲刺距离和每个球员投入的高强度运动次数。我们这样监测一整个赛季下来,就能知道一个球员目前状态是否疲劳,以及他需要多久的休息时间。
大数据分析速滑的诀窍
说完了团体运动的足球,再来看看更侧重于个人的速度滑冰,虽然它不是那么的职业化,但是这种更强调个人技巧的运动,大数据对其的作用更大。
2010年,4年前的温哥华冬奥会,前4项比赛,韩国速度滑冰运动员获得2金1银的优异表现,要知道这是在堪称“短道速滑之国”的国家在温哥华大道赛场上所取得的,其中的秘诀何在?
之后,人们从数据方面分析,发现韩国队的拐弯时候,速度比其他国家的要快。通过这个大数据的分析,再结合慢镜头,人们发现了韩国队的先进技术:在过弯时,通过身体重点心转移,步点的转换,达到一个不减速的效果,甚至还可以加速。
就是凭借这个先进技术,一时间在温哥华的赛场刮起“韩流”。
大数据已经很大程度上影响到职业体育的水平,另一方面,对于职业体育来说,所从事的运动不同对于大数据有不同的应用需求,例如,足球和篮球所遇到的大数据问题是不一样的,团体与个人的运动又会是大不同。海量数据处理的复杂性,对数据中心的计算能力提出了挑战,英特尔就正利用自己在计算领域长久的积累,从支撑计算的芯片产品,到实现分析的解决方案,在职业体育上发挥着不可替代的作用。 好教练难求,但是经过计算和处理的多维度的数据却是可以普及和借鉴的。大数据改变职业体育,并赋予职业体育全新的商业价值,并非一件遥不可及的事。
当然大数据也有其局限性,埃弗顿主教练马丁内斯和他的球探里弗斯和布朗都认为“光凭数据就能买进某个球员”这种想法是十分荒谬的,博尔顿的分析研究总监布莱恩·普莱斯迪奇甚至举出了一个反例:自从他们的守门员开始研究对方的点球手的数据以后,他的扑点球效率反而降低了,过去两个赛季只有9%的成功率。
职业体育与大数据结合,确实对职业体育影响很大,也得出了很多有用的结论,但通过大数据彻底影响比赛结果,目前可能性不大,体育运动,其最大的魅力恰恰在于不可完全预测的下一秒。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据工作的全流程中,数据清洗是最基础、最耗时,同时也是最关键的核心环节,无论后续是做常规数据分析、可视化报表,还是开展 ...
2026-03-20在大数据与数据驱动决策的当下,“数据分析”与“数据挖掘”是高频出现的两个核心概念,也是很多职场人、入门学习者容易混淆的术 ...
2026-03-20在CDA(Certified Data Analyst)数据分析师的全流程工作闭环中,统计制图是连接严谨统计分析与高效业务沟通的关键纽带,更是CDA ...
2026-03-20在MySQL数据库优化中,分区表是处理海量数据的核心手段——通过将大表按分区键(如时间、地域、ID范围)分割为多个独立的小分区 ...
2026-03-19在商业智能与数据可视化领域,同比、环比增长率是分析数据变化趋势的核心指标——同比(YoY)聚焦“长期趋势”,通过当前周期与 ...
2026-03-19在数据分析与建模领域,流传着一句行业共识:“数据决定上限,特征决定下限”。对CDA(Certified Data Analyst)数据分析师而言 ...
2026-03-19机器学习算法工程的核心价值,在于将理论算法转化为可落地、可复用、高可靠的工程化解决方案,解决实际业务中的痛点问题。不同于 ...
2026-03-18在动态系统状态估计与目标跟踪领域,高精度、高鲁棒性的状态感知是机器人导航、自动驾驶、工业控制、目标检测等场景的核心需求。 ...
2026-03-18“垃圾数据进,垃圾结果出”,这是数据分析领域的黄金法则,更是CDA(Certified Data Analyst)数据分析师日常工作中时刻恪守的 ...
2026-03-18在机器学习建模中,决策树模型因其结构直观、易于理解、无需复杂数据预处理等优势,成为分类与回归任务的首选工具之一。而变量重 ...
2026-03-17在数据分析中,卡方检验是一类基于卡方分布的假设检验方法,核心用于分析分类变量之间的关联关系或实际观测分布与理论期望分布的 ...
2026-03-17在数字化转型的浪潮中,企业积累的数据日益庞大且分散——用户数据散落在注册系统、APP日志、客服记录中,订单数据分散在交易平 ...
2026-03-17在数字化时代,数据分析已成为企业决策、业务优化、增长突破的核心支撑,从数据仓库搭建(如维度表与事实表的设计)、数据采集清 ...
2026-03-16在数据仓库建设、数据分析(尤其是用户行为分析、业务指标分析)的实践中,维度表与事实表是两大核心组件,二者相互依存、缺一不 ...
2026-03-16数据是CDA(Certified Data Analyst)数据分析师开展一切工作的核心载体,而数据读取作为数据生命周期的关键环节,是连接原始数 ...
2026-03-16在用户行为分析实践中,很多从业者会陷入一个核心误区:过度关注“当前数据的分析结果”,却忽视了结果的“泛化能力”——即分析 ...
2026-03-13在数字经济时代,用户的每一次点击、浏览、停留、转化,都在传递着真实的需求信号。用户行为分析,本质上是通过收集、整理、挖掘 ...
2026-03-13在金融、零售、互联网等数据密集型行业,量化策略已成为企业挖掘商业价值、提升决策效率、控制经营风险的核心工具。而CDA(Certi ...
2026-03-13在机器学习建模体系中,随机森林作为集成学习的经典算法,凭借高精度、抗过拟合、适配多场景、可解释性强的核心优势,成为分类、 ...
2026-03-12在机器学习建模过程中,“哪些特征对预测结果影响最大?”“如何筛选核心特征、剔除冗余信息?”是从业者最常面临的核心问题。随 ...
2026-03-12