今天凌晨4点,德国对巴西的世界杯本决赛给了所有人一个大大的惊叹号。德国7:1战胜巴西,让人瞠目,巴西如此惨败,实属难料。也许连谷歌的大数据预测也没有预测到7:1的悬殊差距。
在这种情况下,讨论用大数据精准预测世界可能稍显牵强,但是毕竟,大数据预测是趋势。
大数据发展到今天,虽然离完美预测还有一段距离,然而,不可否认,相信数据比相信直觉更加靠谱。抛开今天凌晨这场“大比分”的比赛不谈,谷歌、百度、微软等通过分析大数据对世界杯的前期预测准确的同样让人惊奇。
谷歌的云计算平台成功预测了世界杯16强比赛每场比赛的胜利者。据了解,谷歌使用来自实时体育比赛数据公司Opta Sports的数据,以及由BigQuery工程师乔丹·提加尼开发的实力排行榜系统,更考虑了观众热情程度数据,以计算出主队优势,从而预测赛果。此 外,谷歌使用这一系统来预测世界杯8强的比赛,结果也惊人地准确:巴西对哥伦比亚,巴西胜概率为71%;法国对德国,法国胜概率为69%;荷兰对哥斯达黎 加,荷兰胜概率为68%;阿根廷对比利时,阿根廷胜概率为81%。
事实上,对于预测结果,谷歌并不是唯一做出完美预测的公司,百度、微软必应也进行了预测,大家的共同点都在于是依据云数据系统的综合分析来做出预测。
随着大数据行业的发展,谷歌、亚马逊、阿里、百度、腾讯,都因为拥有大量的用户注册和运营信息,自然地成为大数据公司。各种数据的记录也许看起来是随机的,但是当这些数据由光速电脑进行分析之后,便会揭示出影像、模式、联系和趋势,不仅可以提高业务绩效,更改变生活。
谷歌、百度等搜索引擎不仅存储了搜索结果中出现的网络连接,还会储存用户搜索关键词的行为,它能够精准地记录下人们进行搜索行为的时间、内容和方式,在你意识到自己要找什么之前预测出你的意图。
去年春节期间,百度已经开始了对于春节人口流动趋势的预测;今年清明和五一,百度对全国各大景区、城市的人流热度做了预测,其针对2014年高考作 文命题方向的预测更是“命中”了全国18套考题中的12套。据了解,百度的“高考预测”还可以利用历史搜索数据、历年的录取分数、各批次省控线预测全国各 个大学的报考热度、难度,各种专业的报考趋势以及本省考生都对哪些专业、学校感兴趣等。百度CEO李彦宏表示,“对数据的挖掘整理只是大数据技术的初级阶 段。除了通过大数据分析规律、趋势,机器必须还要会自主思考才行。”
除了IT企业计划的疾病预测、房地产预测、就业预测、金融预测,我国疾控中心也计划运用大数据,提前确定一定规模的未知疾病,为疫情控制争取时间。
不过,从目前来看,大数据的分析预测能力还远未完善。2009年,甲型H1N1流感爆发的几周前,“谷歌流感趋势”预测了流感在美国境内的传播,其 分析结果甚至具体到特定的地区和州,并且非常及时,令公共卫生官员倍感震惊。不过,2013年,谷歌对于流感的预测与美国疾病控制中心汇总后的结果相比, 夸大了几乎一倍。
业界认为,未来“大数据的精准分析不仅有赖于数据资源的扩充,更要基于大数据引擎的发展进步。”据了解,IBM已推出大数据行业方案,英特尔入股了大数据初创企业Cloudera,还推出了基于Hidoop的“大数据引擎”。
专家:
数据协同和隐私问题待解
谷歌、IBM、甲骨文、SAP等企业在大数据领域进行了技术创新,越来越多的国外企业凭借技术优势和先行经验进军大数据市场。然而,我国大数据产业 发展仍然处于起步阶段。“每一次点击、触摸、短信、微信、微博、驾驶、飞行、通话、拍照、购买等都产生数据……虽然每天在产生大量数据,却没有显示出足够 的威力。”赛迪顾问分析师表示,“交通部门有车联网、物联网、路网监控、船联网、码头车站监控等地方的大数据,卫生部门拥有流感法定报告数据、全国流感样 病例哨点监测和病原学监测数据,公安部门有大量的视频监控数据,但政府部门几乎都没有大数据处理和挖掘技术。”
除了互联网公司,沃尔玛、中国移动等传统企业也掌握着大量用户数据,平台企业互相独立地应用数据淘金,各取所需,但数据的私密占有严重制约着大数据的广泛应用和融合发展。“大数据的协同可以实现智能路径规划、运力管理、流感预测、疫苗接种指导、安防追逃等。”
《大数据时代》一书中指出,“大数据本身探寻的是一种趋势,而非精准性,若要无限接近统计结果,必须让大数据与精细的传统统计方法互补,而非两者相互替代。”
此外,数据的隐私问题也仍然待解。谷歌斥巨资投入的癌症预测项目中,仅有4%的癌症患者参与到了临床试验数据库项目中,这也就意味着高达96%病患的医疗和综合体征信息难以被其他医疗机构或者医生轻易获悉。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
CDA持证人简介: 杨贞玺 ,CDA一级持证人,郑州大学情报学硕士研究生,某上市公司数据分析师。 学习入口:https://edu.cda.cn/g ...
2025-05-09CDA持证人简介 程靖 CDA会员大咖,畅销书《小白学产品》作者,13年顶级互联网公司产品经理相关经验,曾在百度、美团、阿里等 ...
2025-05-07相信很多做数据分析的小伙伴,都接到过一些高阶的数据分析需求,实现的过程需要用到一些数据获取,数据清洗转换,建模方法等,这 ...
2025-05-06以下的文章内容来源于刘静老师的专栏,如果您想阅读专栏《10大业务分析模型突破业务瓶颈》,点击下方链接 https://edu.cda.cn/g ...
2025-04-30CDA持证人简介: 邱立峰 CDA 数据分析师二级持证人,数字化转型专家,数据治理专家,高级数据分析师,拥有丰富的行业经验。 ...
2025-04-29CDA持证人简介: 程靖 CDA会员大咖,畅销书《小白学产品》作者,13年顶级互联网公司产品经理相关经验,曾在百度,美团,阿里等 ...
2025-04-28CDA持证人简介: 居瑜 ,CDA一级持证人国企财务经理,13年财务管理运营经验,在数据分析就业和实践经验方面有着丰富的积累和经 ...
2025-04-27数据分析在当今信息时代发挥着重要作用。单因素方差分析(One-Way ANOVA)是一种关键的统计方法,用于比较三个或更多独立样本组 ...
2025-04-25CDA持证人简介: 居瑜 ,CDA一级持证人国企财务经理,13年财务管理运营经验,在数据分析就业和实践经验方面有着丰富的积累和经 ...
2025-04-25在当今数字化时代,数据分析师的重要性与日俱增。但许多人在踏上这条职业道路时,往往充满疑惑: 如何成为一名数据分析师?成为 ...
2025-04-24以下的文章内容来源于刘静老师的专栏,如果您想阅读专栏《刘静:10大业务分析模型突破业务瓶颈》,点击下方链接 https://edu.cda ...
2025-04-23大咖简介: 刘凯,CDA大咖汇特邀讲师,DAMA中国分会理事,香港金管局特聘数据管理专家,拥有丰富的行业经验。本文将从数据要素 ...
2025-04-22CDA持证人简介 刘伟,美国 NAU 大学计算机信息技术硕士, CDA数据分析师三级持证人,现任职于江苏宝应农商银行数据治理岗。 学 ...
2025-04-21持证人简介:贺渲雯 ,CDA 数据分析师一级持证人,互联网行业数据分析师 今天我将为大家带来一个关于用户私域用户质量数据分析 ...
2025-04-18一、CDA持证人介绍 在数字化浪潮席卷商业领域的当下,数据分析已成为企业发展的关键驱动力。为助力大家深入了解数据分析在电商行 ...
2025-04-17CDA持证人简介:居瑜 ,CDA一级持证人,国企财务经理,13年财务管理运营经验,在数据分析实践方面积累了丰富的行业经验。 一、 ...
2025-04-16持证人简介: CDA持证人刘凌峰,CDA L1持证人,微软认证讲师(MCT)金山办公最有价值专家(KVP),工信部高级项目管理师,拥有 ...
2025-04-15持证人简介:CDA持证人黄葛英,ICF国际教练联盟认证教练,前字节跳动销售主管,拥有丰富的行业经验。在实际生活中,我们可能会 ...
2025-04-14在 Python 编程学习与实践中,Anaconda 是一款极为重要的工具。它作为一个开源的 Python 发行版本,集成了众多常用的科学计算库 ...
2025-04-14随着大数据时代的深入发展,数据运营成为企业不可或缺的岗位之一。这个职位的核心是通过收集、整理和分析数据,帮助企业做出科 ...
2025-04-11