
大数据正引发新一轮革命 看待大数据还需“大眼界”
当人们享受被电商的大数据“算计”而带来的方便和廉价时,有时也会陷入它是否有损实体经济、是否破坏个人隐私等担忧。
纠结于此类担忧甚至争论,人们往往容易忽视大数据更宏大的意义:在促进传统行业升级改造、引领新兴产业和新兴应用蓬勃发展、提升社会运行和管理效率等方面,大数据正引发新一轮革命。人们看待大数据的眼光也亟待与时俱进。 传统产业大升级
“喷气式客机一起飞,就会产生海量数据”清华大学信息技术研究院研究员薛一波接受新华社记者采访时介绍,“分析客机实时传输的大数据,可实时掌握飞机的运行状态,提前预警和发现潜在问题,采取预防、维修等措施,大大减少故障率。”
类似技术也应用在高铁上。薛一波说,以往铁路工人在铁轨上敲敲打打,通过声音检查问题;如今,高铁上的各种传感设备可实时传回车辆数据,通过大数据分析,即可实现故障预警、诊断、排查和定位,提高效率,降低成本。
他说,大数据分析可大幅提升传统行业的运行效率、降低运维成本、提升数据价值,在欧美等发达国家,工业大数据应用已非常普及。
“大数据技术推动传统产业升级是必然的,”暨南大学信息学院/网络空间安全学院副院长郑力明对记者说,比如,德国积极推动包含工业大数据应用在内的“工业4.0”计划,正是要进一步促使工业生产与信息技术融合,使供应、制造、销售各环节智慧化。
鉴于大数据更广泛的潜力,早在2012年,世界经济论坛就发布《大数据·大影响》报告指出,数据已成为一种像黄金和货币一样的经济资产。
如今,大数据巨大的商业价值正成为推动经济变革的新引擎。中国工信部已印发《大数据产业发展规划(2016-2020年)》,提出到2020年基本形成技术先进、应用繁荣、保障有力的大数据产业体系。大数据相关产品和服务业务收入将突破1万亿元人民币,年均复合增长率保持30%左右。
“现在的突出问题,一是许多传统企业行业和机构缺乏新思维,没有意识到,甚至不清楚大数据这种战略资源的价值所在;二是缺乏机构间融合和深度合作,有数据的不知怎么用,会用的没有数据,因此需要打破条条框框、利益分割,共同促进大数据产业链的健康发展,”薛一波说,“除消费领域外,更多传统企业的大数据思维应成为行业共识。”
“天算”挖掘大价值
“人算不如天算,天算就是云计算,”阿里巴巴集团董事局主席马云日前在深圳IT领袖峰会上强调了云计算的重要。
今年1月初,谷歌、微软、阿里巴巴和英特尔等科技巨头相继公布的季报均显示:云计算已成为这些技术巨头最大的增长引擎。
如今,说起大数据,人们往往会提到云计算,可云计算与大数据又是什么关系?可以说,大数据与云计算一个是问题,一个是解决问题的方法。
从问题看,当前社会的数据资源正呈指数级增长。薛一波说,2006年,个人用户才刚刚迈进TB(1TB相当于10的12次方字节)时代,而全球共新产生约180EB(1EB相当于10的18次方字节)数据;到了2011年,这个数字达到1.8ZB(1ZB相当于10的21次方字节)。有市场研究机构预测,到2020年,整个世界的数据总量将会达到35.2ZB。
对于如此大量的非结构数据,传统计算机分析已难以胜任,集分布式计算、效用计算、网络存储、虚拟化等为一体的云计算应运而生。通过云计算对大数据进行分析,才能释放出更多数据的隐藏价值。
“因此,从技术上看,大数据与云计算的关系就像一枚硬币的正反面一样密不可分,”《大数据时代》作者、英国牛津大学教授维克托·迈尔-舍恩伯格这样解释。
他还认为,大数据要求人们改变对精确性的苛求,转而追求混杂性,并找出数据间的关联。这种思维的转变将是革命性的,而云计算是发现并征服这些巨量混杂性数据的“利器”。
去年7月,美国高德纳咨询公司曾估计,未来5年内IT产业将有超过1万亿美元支出,直接或间接促进企业向云计算领域转型。
与云计算相伴的是行业人才培养问题凸显。全球知名职业人士社交网站“领英”公布的最受雇主青睐且最抢手技能中,云计算排名第一。郑力明也指出,目前中国发展大数据和云计算最大的问题在于人才,尤其是企业界需要大量人才。
打通信息“大动脉”
统计显示,目前我国信息数据资源80%以上掌握在各级政府部门手里,“深藏闺中”造成极大浪费。一些地方和部门的信息化建设各自为政,形成“信息孤岛”和“数据烟囱”,给应用带来不便。
中国人民大学调查与数据中心副主任、社会学系副教授王卫东认为,数据开放意义重大。因为大数据最初是用数据模型采集的各种信息的总和,开放数据能帮助研究人员找到之前看来不相干的事物间的关联,然后据此找到更精确的计算参数。开放程度越高,参数设置和分析就会越精准,得出的信息参考价值越高。
正因如此,“开放数据”已成为一股世界性运动,各国政府则成为这场运动中最重要的对象。推动信息跨部门跨层级共享共用,加快推进公共数据资源向社会开放,已经成为政府工作的重要目标。
2015年中国国务院印发的《促进大数据发展行动纲要》明确指出,数据已成为国家的基础性战略资源,要大力推动政府信息系统和公共数据互联开放共享,加快政府信息平台整合,消除信息孤岛,推进数据资源向社会开放,增强政府公信力,引导社会发展,服务公众企业。
所谓信息化,不仅在于“有”,更在于“通”。尤其是在互联网时代,信息必须实现有效流通和共享,才谈得上“化”。当今世界,信息化发展不进则退。加强信息基础设施建设,强化信息资源深度整合,让大数据思维与时俱进,才能打通经济社会发展的信息“大动脉”。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
R 语言:数据科学与科研领域的核心工具及优势解析 一、引言 在数据驱动决策的时代,无论是科研人员验证实验假设(如前文中的 T ...
2025-09-08T 检验在假设检验中的应用与实践 一、引言 在科研数据分析、医学实验验证、经济指标对比等领域,常常需要判断 “样本间的差异是 ...
2025-09-08在商业竞争日益激烈的当下,“用数据说话” 已从企业的 “加分项” 变为 “生存必需”。然而,零散的数据分析无法持续为业务赋能 ...
2025-09-08随机森林算法的核心特点:原理、优势与应用解析 在机器学习领域,随机森林(Random Forest)作为集成学习(Ensemble Learning) ...
2025-09-05Excel 区域名定义:从基础到进阶的高效应用指南 在 Excel 数据处理中,频繁引用单元格区域(如A2:A100、B3:D20)不仅容易出错, ...
2025-09-05CDA 数据分析师:以六大分析方法构建数据驱动业务的核心能力 在数据驱动决策成为企业共识的当下,CDA(Certified Data Analyst) ...
2025-09-05SQL 日期截取:从基础方法到业务实战的全维度解析 在数据处理与业务分析中,日期数据是连接 “业务行为” 与 “时间维度” 的核 ...
2025-09-04在卷积神经网络(CNN)的发展历程中,解决 “梯度消失”“特征复用不足”“模型参数冗余” 一直是核心命题。2017 年提出的密集连 ...
2025-09-04CDA 数据分析师:驾驭数据范式,释放数据价值 在数字化转型浪潮席卷全球的当下,数据已成为企业核心生产要素。而 CDA(Certified ...
2025-09-04K-Means 聚类:无监督学习中数据分群的核心算法 在数据分析领域,当我们面对海量无标签数据(如用户行为记录、商品属性数据、图 ...
2025-09-03特征值、特征向量与主成分:数据降维背后的线性代数逻辑 在机器学习、数据分析与信号处理领域,“降维” 是破解高维数据复杂性的 ...
2025-09-03CDA 数据分析师与数据分析:解锁数据价值的关键 在数字经济高速发展的今天,数据已成为企业核心资产与社会发展的重要驱动力。无 ...
2025-09-03解析 loss.backward ():深度学习中梯度汇总与同步的自动触发核心 在深度学习模型训练流程中,loss.backward()是连接 “前向计算 ...
2025-09-02要解答 “画 K-S 图时横轴是等距还是等频” 的问题,需先明确 K-S 图的核心用途(检验样本分布与理论分布的一致性),再结合横轴 ...
2025-09-02CDA 数据分析师:助力企业破解数据需求与数据分析需求难题 在数字化浪潮席卷全球的当下,数据已成为企业核心战略资产。无论是市 ...
2025-09-02Power BI 度量值实战:基于每月收入与税金占比计算累计税金分摊金额 在企业财务分析中,税金分摊是成本核算与利润统计的核心环节 ...
2025-09-01巧用 ALTER TABLE rent ADD INDEX:租房系统数据库性能优化实践 在租房管理系统中,rent表是核心业务表之一,通常存储租赁订单信 ...
2025-09-01CDA 数据分析师:企业数字化转型的核心引擎 —— 从能力落地到价值跃迁 当数字化转型从 “选择题” 变为企业生存的 “必答题”, ...
2025-09-01数据清洗工具全景指南:从入门到进阶的实操路径 在数据驱动决策的链条中,“数据清洗” 是决定后续分析与建模有效性的 “第一道 ...
2025-08-29机器学习中的参数优化:以预测结果为核心的闭环调优路径 在机器学习模型落地中,“参数” 是连接 “数据” 与 “预测结果” 的关 ...
2025-08-29