京公网安备 11010802034615号
经营许可证编号:京B2-20210330
互联网最尖端的竞争集中在大数据
2015中关村大数据日的峰会上,中国科学院院士张平文举了一个有趣例子:前一阵,他有家人甲状腺不适,院士有天晚上查了甲状腺知识,第二天就收到微信好友申请,有专治甲状腺的医生想加他为好友,院士感概说,“没有人怀疑我们就生活在大数据时代,”
2015年以来,从“大众创业、万众创新”,一直到“互联网+”以及大数据发展行动纲要,国家利好政策不断,行业领军者开拓创新,中国大数据产业群正快速形成,大数据在交通、工业、社交等领域的应用也日新月异。大数据,正在开启一个认知的新时代,这是一座新的商业宝藏,也正酝酿着一场全新的较量。
“最尖端的竞争”
过去3年,打车应用真正改变了大众出行,滴滴快的CEO程维在大数据日峰会分享说,“中国80%的出租车司机通过滴滴连接在一起,又顺势推出了滴滴专车、快车、顺风车、巴士等系列新业务,希望将有相同出行需求的人连接在一起,实现任何人在任何时间、任何地点在3分钟内叫到一辆车。”
美好的愿景完全依赖于大数据的支持。直到现在,程维依然清晰地记得一宗“事故”:2013年有一次北京大雨,CBD国贸地区用户打不到车,滴滴技术团队梳理订单后发现,绝大多数的订单根本发不出去,“我们最初德尔大数据算法是将一个订单发给附近1-3公里的司机,在订单非常多的时候,司机信道变成稀缺资源,就无法接到更多的订单。”
程维很快发现,当一个城市日均订单超过1万单后,原始的大数据算法即成为瓶颈,于是,滴滴将建设中国最好的大数据团队当成公司战略,为实现用户和司机的快速匹配,迄今后台已经多个版本的大数据结构和算法。
大数据在交通的应用,并不限于打车。构建了完整大数据产业平台的北京久其软件公司,曾为江苏省提供智能化交通统计监测系统,将所有江苏省内高速出入口的视频以及海运、河运、港口等所有的音视频的数据全部纳入体系,进行实时监控。久其软件副总裁钱晖分享说,“在江苏省内,如果你的车被偷或者号牌模糊,系统在一秒钟之内就能实现号牌识别。”
钱晖表示,智慧交通系统积累的数据,服务范围不限于交通,比如经济学有所谓“克强指数”(即以工业用电量新增、铁路货运量新增和银行中长期贷款新增的数据,评判GDP的增长),利用智能系统可以监测高速公路出入口大货车的运量,分析实体经济状况,用于经济决策。
提供便利的同时,大数据交通云的难度和复杂度,也远超过一般人的想象。以江苏省的智能交通系统为例,实现数据实时入库、动态更新以及查询,数据量非常大,每年要更新12亿条以上的信息量。
程维认为,交通大数据能力的构建,其复杂程度甚至超过搜索,他将其总结为三大特点:实时性,每过1分钟交通情况以及车的位置都会发生变化;双向互动,需求方用户和供给方司机相互影响,除了满足用户,系统要根据司机喜好推荐最好的订单;集群扰动,比如,100个人或10000人搜索,结果不会有什么区别,但是10个人还是200人一起叫车,运算结果完全不同,“滴滴代表的交通云,涉及深度学习、人工智能等技术前沿,令云平台更智能、更高效,这是公司最重要的事情。”
“互联网的竞争,已从早期的产品竞争、营销竞争、资本竞争,实实在在进入云端、大数据端的竞争,”程维表示,“全球大的互联网出行领域,最尖端的竞争就集中在大数据领域。”
占据技术制高点的背后,是顶尖人才的争夺。滴滴的全球竞争对手,几乎早于他们动手前的半年,就开始收罗全球顶尖大学的大数据研究人员,从主任、专家到一线工作人员,几乎一网打尽,甚至有公司专门派一支队伍在MIT实验室旁蹲守两个月,“先从副主任挖起,再找主任,一个带一个把30多个实验室的人彻底挖空。”
关键在顶层设计
6年前即深耕工业大数据,美林数据总裁王璐深有感触,“大数据对整个工业带来的冲击是太大太大了”,而美林只专注两件事:工业大数据中心的建设以及对数据的分析、挖掘、高维可视化。“‘两化融合’核心是什么?我们认为是数据的管理,只有在工业4.0时代,才实现了‘两化’的强连接,代表工业化和信息化高度嵌入到一个整体系统。”
在王璐看来,大数据时代,就是会用数据说话、决策、管理、创新,如今,整体氛围和思维方式的条件已具备,核心在于大数据技术的挑战,其中,首要的挑战在于组织的顶层设计,“美林帮助很多企业进行顶层设计,两化融合和大数据融合的战略需要复杂组织系统的设计,尤其是数据管理的长效机制,其中,流程和组织最直接的挑战,就是寻找一批懂业务、懂数据还懂分析的人才队伍。”
国家电网信通部主任王继业在峰会分享了其基于顶层设计、布实施后的运营实践。在大数据方面,国家电网首先规划建立了企业级大数据平台,通过大数据平台实现数据的采集、传输以及存储和处理;在大数据平台之上建立决策支持类、实施采集类、在线监测类、计算分析类等大数据业务应用,其中分成10大场景,在不同单位进行相应试点工作。
以电力负荷预测为例,国家电网组织了江苏电力、山东电力两家地区公司,利用大数据技术,基于电力负荷用户档案数据,结合气侯、气温变化等数据,建立用电数据分析模型,实现用电负荷特性分析并且预测未来用点负荷曲线。
比如,江苏电力就构建了数百个分析模型,在2015年4月对于全省的电力用电高峰进行了预测,其判断用电高峰出现在8月6号,预测最高电量为8481万千瓦时,结果,真正出现时间是8月5号,仅仅差一天,而实际发生的最高值为8440万千瓦时,误差率非常之低。
王继业表示,基于顶层设计、有序推进,大数据带来的威力十分之大,国家电网也尝到了甜头,“通过前期试点,负荷预测准确率提高到99.5%,最高负荷发生时间偏差1天,峰谷差率下降了5%;对配电网抢修精益化大数据预测,实时监测、故障预测、抢修达标率析,设备故障预测准确率提升40%,抢修达标率达到15%,抢修时长缩短30分钟。”
事实上,不只工业领域,响应整个社会大数据化,凝聚共识,全力推动大数据产业创新发展,形成政府、社会、市场共同推动、联合治理的发展格局,一样需要顶层设计;而商业公司内部的许多数据,若能在一套规则清晰的制度下进行共享,完全可以应用到宏观经济和社会管理,实现数据价值的最大化。
龙信数据董事长李钰就认为,应用是衡量数据价值唯一标准,龙信即将发布的是中关村企业大数据平台,可记录北京市百万家企业每天的动态的经营和税收情况,可以洞悉全国5千万市场主体与宏观经济内在关系,有百亿的节点在秒级可以进行运算,有深度学习能力,是未来企业数据的智慧大脑,这对于宏观经济决策一样极具价值。
LinkedIn全球副总裁Michael Korcuska在峰会分享了过去3年的领英(LinkedIn)数据积累,也有非常有趣的洞察:基于中国强劲的经济增长,越来越多的人才从全球来到中国,其核心技能主要是经济学、统计分析、化学、社交媒体等领域,而部分离开中国的人士,其所擅长的是城市规划、海洋、导航、水库管理以及传统中医等。Michael Korcuska建议,利用领英的职位数据库,政府可以做两件事:为稀缺人才提供激励机制,与大学合作培养针对性的人才。
峰会最后,宽带资本董事长田溯宁以独有的历史视角,对于大数据应用的前景进行了展望。他认为,人类历史上曾有地理大发现的时代,发现新大陆改变了人类的时空观念,开启了工业革命,而现在,人类社会正迈入“一个数据大发现的时代”,将开启无限的新机会。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
主讲人简介 张冲,海归统计学硕士,CDA 认证数据分析师,前云南白药集团资深数据分析师,自媒体 Python 讲师,全网课程播放量破 ...
2026-04-10在数据可视化与业务分析中,同比分析是衡量业务发展趋势、识别周期波动的核心手段,其核心逻辑是将当前周期数据与上年同期数据进 ...
2026-04-10在机器学习模型的落地应用中,预测精度并非衡量模型可靠性的唯一标准,不确定性分析同样不可或缺。尤其是在医疗诊断、自动驾驶、 ...
2026-04-10数据本身是沉默的,唯有通过有效的呈现方式,才能让其背后的规律、趋势与价值被看见、被理解、被运用。统计制图(数据可视化)作 ...
2026-04-10在全球化深度发展的今天,跨文化传播已成为连接不同文明、促进多元共生的核心纽带,其研究核心围绕“信息传递、文化解读、意义建 ...
2026-04-09在数据可视化领域,折线图是展示时序数据、趋势变化的核心图表类型之一,其简洁的线条的能够清晰呈现数据的起伏规律。Python ECh ...
2026-04-09在数据驱动的时代,数据分析早已不是“凭经验、靠感觉”的零散操作,而是一套具备固定逻辑、标准化流程的系统方法——这就是数据 ...
2026-04-09长短期记忆网络(LSTM)作为循环神经网络(RNN)的重要改进模型,凭借其独特的门控机制(遗忘门、输入门、输出门),有效解决了 ...
2026-04-08在数据分析全流程中,数据质量是决定分析结论可靠性的核心前提,而异常值作为数据集中的“异类”,往往会干扰统计检验、模型训练 ...
2026-04-08在数字经济飞速发展的今天,数据已渗透到各行各业的核心场景,成为解读趋势、优化决策、创造价值的核心载体。而数据分析,作为挖 ...
2026-04-08在数据分析全流程中,数据处理是基础,图形可视化是核心呈现手段——前者负责将杂乱无章的原始数据转化为干净、规范、可分析的格 ...
2026-04-07在数据分析与统计推断中,p值是衡量假设检验结果显著性的核心指标,其本质是在原假设(通常为“无效应”“无差异”)成立的前提 ...
2026-04-07在数字经济深度渗透的今天,数据已成为企业生存发展的核心资产,企业的竞争本质已转变为数据利用能力的竞争。然而,大量来自生产 ...
2026-04-07Python凭借简洁的语法、丰富的生态库,成为算法开发、数据处理、机器学习等领域的首选语言。但受限于动态类型、解释性执行的特性 ...
2026-04-03在深度学习神经网络中,卷积操作是实现数据特征提取的核心引擎,更是让模型“看懂”数据、“解读”数据的关键所在。不同于传统机 ...
2026-04-03当数字化转型从企业的“战略口号”落地为“生存之战”,越来越多的企业意识到,转型的核心并非技术的堆砌,而是数据价值的深度挖 ...
2026-04-03在日常办公数据分析中,数据透视表凭借高效的汇总、分组功能,成为Excel、WPS等办公软件中最常用的数据分析工具之一。其中,“计 ...
2026-04-02在数字化交互的全场景中,用户的每一次操作都在生成动态的行为轨迹——电商用户的“浏览商品→点击详情→加入购物车”,内容APP ...
2026-04-02在数字化转型深度推进的今天,企业数据已成为驱动业务增长、构建核心竞争力的战略资产,而数据安全则是守护这份资产的“生命线” ...
2026-04-02在数据驱动决策的浪潮中,数据挖掘与数据分析是两个高频出现且极易被混淆的概念。有人将二者等同看待,认为“做数据分析就是做数 ...
2026-04-01