
互联网最尖端的竞争集中在大数据
2015中关村大数据日的峰会上,中国科学院院士张平文举了一个有趣例子:前一阵,他有家人甲状腺不适,院士有天晚上查了甲状腺知识,第二天就收到微信好友申请,有专治甲状腺的医生想加他为好友,院士感概说,“没有人怀疑我们就生活在大数据时代,”
2015年以来,从“大众创业、万众创新”,一直到“互联网+”以及大数据发展行动纲要,国家利好政策不断,行业领军者开拓创新,中国大数据产业群正快速形成,大数据在交通、工业、社交等领域的应用也日新月异。大数据,正在开启一个认知的新时代,这是一座新的商业宝藏,也正酝酿着一场全新的较量。
“最尖端的竞争”
过去3年,打车应用真正改变了大众出行,滴滴快的CEO程维在大数据日峰会分享说,“中国80%的出租车司机通过滴滴连接在一起,又顺势推出了滴滴专车、快车、顺风车、巴士等系列新业务,希望将有相同出行需求的人连接在一起,实现任何人在任何时间、任何地点在3分钟内叫到一辆车。”
美好的愿景完全依赖于大数据的支持。直到现在,程维依然清晰地记得一宗“事故”:2013年有一次北京大雨,CBD国贸地区用户打不到车,滴滴技术团队梳理订单后发现,绝大多数的订单根本发不出去,“我们最初德尔大数据算法是将一个订单发给附近1-3公里的司机,在订单非常多的时候,司机信道变成稀缺资源,就无法接到更多的订单。”
程维很快发现,当一个城市日均订单超过1万单后,原始的大数据算法即成为瓶颈,于是,滴滴将建设中国最好的大数据团队当成公司战略,为实现用户和司机的快速匹配,迄今后台已经多个版本的大数据结构和算法。
大数据在交通的应用,并不限于打车。构建了完整大数据产业平台的北京久其软件公司,曾为江苏省提供智能化交通统计监测系统,将所有江苏省内高速出入口的视频以及海运、河运、港口等所有的音视频的数据全部纳入体系,进行实时监控。久其软件副总裁钱晖分享说,“在江苏省内,如果你的车被偷或者号牌模糊,系统在一秒钟之内就能实现号牌识别。”
钱晖表示,智慧交通系统积累的数据,服务范围不限于交通,比如经济学有所谓“克强指数”(即以工业用电量新增、铁路货运量新增和银行中长期贷款新增的数据,评判GDP的增长),利用智能系统可以监测高速公路出入口大货车的运量,分析实体经济状况,用于经济决策。
提供便利的同时,大数据交通云的难度和复杂度,也远超过一般人的想象。以江苏省的智能交通系统为例,实现数据实时入库、动态更新以及查询,数据量非常大,每年要更新12亿条以上的信息量。
程维认为,交通大数据能力的构建,其复杂程度甚至超过搜索,他将其总结为三大特点:实时性,每过1分钟交通情况以及车的位置都会发生变化;双向互动,需求方用户和供给方司机相互影响,除了满足用户,系统要根据司机喜好推荐最好的订单;集群扰动,比如,100个人或10000人搜索,结果不会有什么区别,但是10个人还是200人一起叫车,运算结果完全不同,“滴滴代表的交通云,涉及深度学习、人工智能等技术前沿,令云平台更智能、更高效,这是公司最重要的事情。”
“互联网的竞争,已从早期的产品竞争、营销竞争、资本竞争,实实在在进入云端、大数据端的竞争,”程维表示,“全球大的互联网出行领域,最尖端的竞争就集中在大数据领域。”
占据技术制高点的背后,是顶尖人才的争夺。滴滴的全球竞争对手,几乎早于他们动手前的半年,就开始收罗全球顶尖大学的大数据研究人员,从主任、专家到一线工作人员,几乎一网打尽,甚至有公司专门派一支队伍在MIT实验室旁蹲守两个月,“先从副主任挖起,再找主任,一个带一个把30多个实验室的人彻底挖空。”
关键在顶层设计
6年前即深耕工业大数据,美林数据总裁王璐深有感触,“大数据对整个工业带来的冲击是太大太大了”,而美林只专注两件事:工业大数据中心的建设以及对数据的分析、挖掘、高维可视化。“‘两化融合’核心是什么?我们认为是数据的管理,只有在工业4.0时代,才实现了‘两化’的强连接,代表工业化和信息化高度嵌入到一个整体系统。”
在王璐看来,大数据时代,就是会用数据说话、决策、管理、创新,如今,整体氛围和思维方式的条件已具备,核心在于大数据技术的挑战,其中,首要的挑战在于组织的顶层设计,“美林帮助很多企业进行顶层设计,两化融合和大数据融合的战略需要复杂组织系统的设计,尤其是数据管理的长效机制,其中,流程和组织最直接的挑战,就是寻找一批懂业务、懂数据还懂分析的人才队伍。”
国家电网信通部主任王继业在峰会分享了其基于顶层设计、布实施后的运营实践。在大数据方面,国家电网首先规划建立了企业级大数据平台,通过大数据平台实现数据的采集、传输以及存储和处理;在大数据平台之上建立决策支持类、实施采集类、在线监测类、计算分析类等大数据业务应用,其中分成10大场景,在不同单位进行相应试点工作。
以电力负荷预测为例,国家电网组织了江苏电力、山东电力两家地区公司,利用大数据技术,基于电力负荷用户档案数据,结合气侯、气温变化等数据,建立用电数据分析模型,实现用电负荷特性分析并且预测未来用点负荷曲线。
比如,江苏电力就构建了数百个分析模型,在2015年4月对于全省的电力用电高峰进行了预测,其判断用电高峰出现在8月6号,预测最高电量为8481万千瓦时,结果,真正出现时间是8月5号,仅仅差一天,而实际发生的最高值为8440万千瓦时,误差率非常之低。
王继业表示,基于顶层设计、有序推进,大数据带来的威力十分之大,国家电网也尝到了甜头,“通过前期试点,负荷预测准确率提高到99.5%,最高负荷发生时间偏差1天,峰谷差率下降了5%;对配电网抢修精益化大数据预测,实时监测、故障预测、抢修达标率析,设备故障预测准确率提升40%,抢修达标率达到15%,抢修时长缩短30分钟。”
事实上,不只工业领域,响应整个社会大数据化,凝聚共识,全力推动大数据产业创新发展,形成政府、社会、市场共同推动、联合治理的发展格局,一样需要顶层设计;而商业公司内部的许多数据,若能在一套规则清晰的制度下进行共享,完全可以应用到宏观经济和社会管理,实现数据价值的最大化。
龙信数据董事长李钰就认为,应用是衡量数据价值唯一标准,龙信即将发布的是中关村企业大数据平台,可记录北京市百万家企业每天的动态的经营和税收情况,可以洞悉全国5千万市场主体与宏观经济内在关系,有百亿的节点在秒级可以进行运算,有深度学习能力,是未来企业数据的智慧大脑,这对于宏观经济决策一样极具价值。
LinkedIn全球副总裁Michael Korcuska在峰会分享了过去3年的领英(LinkedIn)数据积累,也有非常有趣的洞察:基于中国强劲的经济增长,越来越多的人才从全球来到中国,其核心技能主要是经济学、统计分析、化学、社交媒体等领域,而部分离开中国的人士,其所擅长的是城市规划、海洋、导航、水库管理以及传统中医等。Michael Korcuska建议,利用领英的职位数据库,政府可以做两件事:为稀缺人才提供激励机制,与大学合作培养针对性的人才。
峰会最后,宽带资本董事长田溯宁以独有的历史视角,对于大数据应用的前景进行了展望。他认为,人类历史上曾有地理大发现的时代,发现新大陆改变了人类的时空观念,开启了工业革命,而现在,人类社会正迈入“一个数据大发现的时代”,将开启无限的新机会。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
解析 F 边界检验:协整分析中的实用工具 在计量经济学的时间序列分析中,判断变量之间是否存在长期稳定的均衡关系(即协整关系) ...
2025-08-05大数据时代的隐患:繁荣背后的隐忧 当我们在电商平台浏览商品时,系统总能 “精准” 推送心仪的物品;当我们刷短视频时,算法 ...
2025-08-05CDA 数据分析师考试全解析 在当今数字化时代,数据已成为企业发展的核心驱动力,数据分析师这一职业也愈发受到重视。CDA 数据分 ...
2025-08-05CDA认证在国际市场上的认可度正在逐渐增长。CDA(Certified Data Analyst)认证,源自中国,面向全球,旨在提升数字化人才的数据 ...
2025-08-04本次活动市场价2000元,现面向会员免费开放,会员朋友更可以邀请一位非会员免费参加。 【活动目标】 ...
2025-08-04MySQL 统计连续每天数据:从业务需求到技术实现 在数据分析场景中,连续日期的数据统计是衡量业务连续性的重要手段 —— 无论是 ...
2025-08-04反向传播神经网络:突破传统算法瓶颈的革命性力量 在人工智能发展的历史长河中,传统算法曾长期主导着数据处理与模式识别领域 ...
2025-08-04CDA 数据分析师行业标准:构建数据人才的能力坐标系 在数据驱动决策成为企业核心竞争力的时代,CDA(数据分析师)行业标准作为 ...
2025-08-04评判两组数据与初始数据准确值的方法 在数据分析与研究中,我们常常会面临这样的情况:需要对通过不同方法、不同过程得到的两组 ...
2025-08-01通过 COX 回归模型诊断异常值 一、COX 回归模型概述 COX 回归模型,又称比例风险回归模型,是一种用于生存分析的统计方法。它能 ...
2025-08-01CDA 数据分析师报考条件详解:迈向专业认证的指南 在数据分析行业蓬勃发展的当下,CDA 数据分析师认证成为众多从业者提升专业 ...
2025-08-01K-S 曲线、回归与分类:数据分析中的重要工具 在数据分析与机器学习领域,K-S 曲线、回归和分类是三个核心概念与工具,它们各 ...
2025-07-31大数据时代对定性分析的影响 在大数据时代,海量、多样、高速且低价值密度的数据充斥着我们的生活与工作。而定性分析作为一 ...
2025-07-31CDA含金量分析 在数字经济与人工智能深度融合的时代,数据驱动决策已成为企业核心竞争力的关键要素。CDA(Certified Data Analys ...
2025-07-31SASEM 决策树:理论与实践应用 在复杂的决策场景中,如何从海量数据中提取有效信息并制定科学决策,是各界关注的焦点。SASEM 决 ...
2025-07-30SPSS 语法使用详解 在当今数据驱动的时代,SPSS( Statistical Package for the Social Sciences)作为一款功能强大的统计分析软 ...
2025-07-30人工智能对CDA数据分析领域的影响 人工智能对 CDA(Certified Data Analyst,注册数据分析师)数据分析领域的影响是全方位、多层 ...
2025-07-30MySQL执行计划中rows的计算逻辑:从原理到实践 MySQL 执行计划中 rows 的计算逻辑:从原理到实践 在 MySQL 数据库的查询优化中 ...
2025-07-29左偏态分布转正态分布:方法、原理与实践 左偏态分布转正态分布:方法、原理与实践 在统计分析、数据建模和科学研究中,正态分 ...
2025-07-29CDA 数据分析师的职业生涯规划:从入门到卓越的成长之路 在数字经济蓬勃发展的当下,数据已成为企业核心竞争力的重要来源,而 CD ...
2025-07-29