京公网安备 11010802034615号
经营许可证编号:京B2-20210330
蕴含巨大潜在经济社会价值 “大数据”热冷静面对
继物联网、云计算之后,大数据已经成为当前信息技术产业最受关注的概念之一。面对社会各界纷纷关注的“大数据”热,应充分认识其内在机理及带来的挑战,进一步理清对策思路。
大数据蕴含着巨大的潜在经济及社会价值
种类繁杂、数量庞大的大数据,为我们更深入、更准确地认识和把握事物发展的内在规律提供了信息基础,其中蕴涵着非常大的潜在价值。这一点不仅是许多业内研究机构的共识,也已经在商业应用中得到了体现。
大数据的应用已经有了许多典型案例,如IBM日本公司利用互联网搜索数据建立的经济指标预测系统,以及美国印第安纳大学利用谷歌公司提供的心情分析工具对道琼斯工业指数变化的预测,已经达到比较高的准确率。除了经济分析外,在农业、医药卫生、制造业等领域,也有一些成功应用大数据进行预测的案例。
据美国麦肯锡公司预测,大数据将为美国医疗服务业每年带来3000亿美元的潜在增加值,为欧洲的公共管理每年带来2500亿欧元的潜在价值,为位置服务产业带来6000亿美元的潜在年收入。零售商充分利用大数据可实现运营利润增长60%,制造业充分利用大数据可降低设备装配成本50%。经合组织(OECD)的一项最新研究成果还对互联网数据的市场价值进行了估计,佐证了大数据的巨大潜在价值。
总体而言,大数据的应用和发展离不开以下三大要素:
一是不同参与主体产生的大量数据信息。这是大数据应用发展的“原材料”基础,也是催生这一概念的基本条件。日本EMC公司与美国IDC公司于2013年年初共同公布了关于大数据方面的最新预测结果:到2020年,人类产生的数据总量将达到40ZB。除了拥有大数据平台的互联网和电子商务企业之外,政府部门、科研院所、高等院校、非营利机构等组织也拥有大量尚未得到有效利用的数据。
二是支撑大数据存储和运算的IT基础设施。这是大数据应用发展所必需的“设备”基础。大数据的存储和高效处理需要云计算数据中心的支撑,大数据的高速传输则需要足够带宽的互联网通道。有了足够的数据承载能力,才有可能进行进一步的分析挖掘。
三是挖掘大数据潜在价值并进行应用的能力。这是大数据产业能否成功发展的“瓶颈”所在。数据量的不断增长尽管带来了巨大的潜在价值,但同时也对我们的价值挖掘能力提出了巨大挑战。2012年全球被创建和被复制的数据总量达2.7ZB,其中较容易处理的有序的结构化数据相对较少,而大量的文本、图片、音视频、医疗影像等非结构化数据则超过85%。如何把这些庞杂无序的数据进行分析、处理和集成,变成有用的信息,是大数据应用发展面临的核心问题。
我国发展大数据应用需冷静面对诸多挑战
据国内有关研究机构初步统计,目前我国大数据产业还处于发展初期,市场规模仍然比较小,2012年仅为4.5亿元,而且主导厂商仍以外企居多。据预测,2016年我国大数据应用的整体市场规模将突破百亿元量级,未来将形成全球最大的大数据产业带。事实上,相对于发展前景的乐观预测,我国发展大数据产业面临的现实挑战更值得认真分析和对待。
首先,如何使分散在不同部门和主体的数据得到合理有效应用。需要明确哪些数据可以用、哪些数据不能任意地进行商业应用。大量的互联网数据掌控在企业手中,但是属于个人隐私或涉及国家信息安全的则应该进行合理限制和规范。对于政府部门、研究机构和高校掌握的专业数据,则须明确是否应向社会公众开放。
其次,如何构建可支撑大数据的IT基础设施。这一点涉及到对传统数据中心的改造和利用、新型云计算存储和处理系统的建设,以及如何尽快建设一个高速、方便接入的互联网通道。
第三,如何掌握大数据挖掘技术和培养大数据专业人才。大数据分析需要相关技术与人才的支撑。发达国家的部分IT企业已经初步掌握了一些数据分析预测的关键技术,我国相关企业的技术能力还比较落后。麦肯锡公司预测美国到2018年需要大数据分析人才40多万,人才缺口将达10多万。我国刚刚引入大数据概念,人才匮乏问题更加突出。
第四,如何避免未来出现大数据产业重复建设甚至产能过剩问题。近几年来,部分新兴产业已经出现了产能过剩的苗头,体制性原因导致的重复、超前建设问题比较突出。对于热度正高的大数据产业,如何避免因政府不当干预导致这些问题重演,是对我国当前区域竞争下产业发展体制的一个挑战。
做好基础性工作,促进大数据应用发展
面对社会各界的“大数据”热,应理性分析、冷静观察,扎实做好几个方面的基础性工作。这些工作可能是长期性、前瞻性的,需要逐步推进,很难立竿见影、一蹴而就。
第一,不必急于出台战略性规划和设立产业专项资金。国内的IT企业和地方政府已经意识到大数据产业的发展前景,对发展大数据应用有着较大热情。某些城市已经启动了大数据发展战略,计划到2017年形成至少500亿元的产业规模。在这种情况下,以规划和专项资金等方式进行鼓励,有可能扭曲正常的市场行为,甚至催生泡沫。
第二,合理改造、建设和布局IT基础设施。对现有的传统数据中心及大量的旧服务器资源,可以通过建立虚拟数据中心或进行就近合并等方式进行改造利用,探索如何通过虚拟化技术和云计算平台管理软件来提高利用效率。对新建的大规模云计算数据中心应进行统筹、合理布局,协调不同省市之间加强互补合作,将能源和气候因素作为项目建设的重要条件,保证经济上的合理性。按照网络建设适度超前于产业发展的原则,加快“宽带普及提速工程”的推进速度,尽快解决大数据应用发展的网络带宽瓶颈。
第三,推动数据隐私保护和公共机构信息公开等立法修法工作。2012年12月,全国人大常委会通过了《关于加强网络信息保护的决定》。应在此基础上继续完善个人隐私保护的相关立法,对哪些互联网个人数据可以进行商业化应用、应用范围如何界定、数据滥用应承担哪些责任等具体问题做出规范。应继续推动政府及公益性机构信息公开,对政府信息公开条例进行修改完善,清晰界定各部门和机构数据公开的对象、时限和应用范围,使更多的可公开数据得到合理应用。此外,对于哪些数据可以向境外流动或允许境外企业开发利用,也应有相应的法律规定。
第四,资助大数据竞争前技术的研究,培养大数据分析人才。在现有政府科技计划中,适度安排项目资金支持大数据关键技术的研发,重点在于竞争前技术,鼓励企业牵头或参与承担。人才培养应从高等教育和企业技术人员再培训两个方面入手,允许大学设立大数据相关专业并进行招生,鼓励地方政府出台关于大数据技术人才培训的相关政策。
CDA学员免费下载查看报告全文:2026全球数智化人才指数报告【CDA数据科学研究院】.pdf
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据驱动运营的时代,指标是连接业务目标与实际行动的核心桥梁,是企业解读业务现状、发现问题、预判趋势的“量化标尺”。一套 ...
2026-05-08在存量竞争日趋激烈的商业时代,“以客户为中心”早已从口号落地为企业运营的核心逻辑。而客户画像作为打通“了解客户”与“服务 ...
2026-05-08 很多数据分析师每天与Excel打交道,但当被问到“什么是表格结构数据”“它和表结构数据有什么区别”“表格结构数据有哪些核 ...
2026-05-08在数据分析、计量研究等场景中,回归分析是探究变量间量化关系的核心方法,无论是简单的一元线性回归,还是复杂的多元线性回归、 ...
2026-05-07在数据分析、计量研究等场景中,回归分析是探究变量间量化关系的核心方法,无论是简单的一元线性回归,还是复杂的多元线性回归、 ...
2026-05-07 很多数据分析师画过趋势图、做过业绩预测,但当被问到“这个月销售额增长20%,到底是长期趋势自然增长,还是促销活动的短期 ...
2026-05-07在数字化时代,商业竞争的核心已从“经验驱动”转向“数据驱动”,越来越多的企业意识到,商业分析不是简单的数据统计与报表呈现 ...
2026-05-06在Excel数据透视表的实操中,“引用”是连接透视表与公式、辅助数据的核心操作,而相对引用作为最基础、最常用的引用方式,其设 ...
2026-05-06 很多数据分析师做过按月份的销售额趋势图,画过按天的流量折线图,但当被问到“时间序列和普通数据有什么本质区别”“季节性 ...
2026-05-06在Excel数据分析中,数据透视表是汇总、整理海量数据的高效工具,而公式则是实现数据二次计算、逻辑判断的核心功能。实际操作中 ...
2026-04-30Excel透视图是数据分析中不可或缺的工具,它能将透视表中的数据快速可视化,帮助我们直观捕捉数据规律、呈现分析结果。但在实际 ...
2026-04-30 很多数据分析师能熟练地计算指标、搭建标签体系,但当被问到“画像到底在解决什么问题”“画像和标签是什么关系”“画像如何 ...
2026-04-30在中介效应分析中,人口统计学变量(如年龄、性别、学历、收入、职业等)是常见的控制变量或调节变量,其处理方式直接影响分析结 ...
2026-04-29在SQL数据库实操中,日期数据的存储与显示是高频需求,而“数字日期”(如20240520、20241231、45321)是很多开发者、数据分析师 ...
2026-04-29 很多分析师在设计标签时思路清晰,但真到落地环节却面临“数据在手,不知如何转化为可用标签”的困境:或因加工方式选择不当 ...
2026-04-29在手游行业竞争日趋白热化的当下,“流量为王”早已升级为“留存为王”,而付费用户留存率更是衡量一款手游盈利能力、运营质量的 ...
2026-04-28在日常MySQL数据库运维与开发中,经常会遇到“同一台服务器上,两个不同数据库(以下简称“源库”“目标库”)的表数据需要保持 ...
2026-04-28 很多分析师每天和数据打交道,但当被问到“标签是什么”“标签和指标有什么区别”“标签体系如何设计”时,却常常答不上来。 ...
2026-04-28箱线图(Box Plot)作为一种经典的数据可视化工具,广泛应用于统计学、数据分析、科研实证等领域,核心价值在于直观呈现数据的集 ...
2026-04-27实证分析是社会科学、自然科学、经济管理等领域开展研究的核心范式,其核心逻辑是通过对多维度数据的收集、分析与解读,揭示变量 ...
2026-04-27