京公网安备 11010802034615号
经营许可证编号:京B2-20210330
理性看待“大数据”热_数据分析师
理性看待“大数据”热
国务院发展研究中心技术经济研究部 田杰棠
继物联网、云计算之后,大数据已经成为当前信息技术产业最受关注的概念之一。面对社会各界纷纷关注的“大数据”热,应充分认识其内在机理及带来的挑战,进一步理清对策思路
种类繁杂、数量庞大的大数据,为我们更深入、更准确地认识和把握事物发展的内在规律提供了信息基础,其中蕴涵着非常大的潜在价值。这一点不仅是许多业内研究机构的共识,也已经在商业应用中得到了体现。
目前,大数据的应用已经有了许多典型案例,如IBM日本公司利用互联网搜索数据建立的经济指标预测系统,以及美国印第安纳大学利用谷歌公司提供的心情分析工具对道琼斯工业指数变化的预测,已经达到比较高的准确率。除了经济分析外,在农业、医药卫生、制造业等领域,也有一些成功应用大数据进行预测的案例。据美国麦肯锡公司预测,大数据将为美国医疗服务业每年带来3000亿美元的潜在增加值,为欧洲的公共管理每年带来2500亿欧元的潜在价值,为位置服务产业带来6000亿美元的潜在年收入。零售商充分利用大数据可实现运营利润增长60%,制造业充分利用大数据可降低设备装配成本50%。经合组织的一项最新研究成果还对互联网数据的市场价值进行了估计,佐证了大数据的巨大潜在价值。
相对而言,目前我国大数据产业还处于发展初期,市场规模仍然比较小,2012年仅为4.5亿元,而且主导厂商仍以外企居多。据预测,2016年我国大数据应用的整体市场规模将突破百亿元量级,未来将形成全球最大的大数据产业带。然而,相对于发展前景的乐观预测,我国发展大数据产业面临的现实挑战更值得认真分析和对待。
一是如何使分散在不同部门和主体的数据得到合理有效应用。需要明确哪些数据可以用、哪些数据不能任意地进行商业应用。二是如何构建可支撑大数据的IT基础设施。这一点涉及对传统数据中心的改造和利用、新型云计算存储和处理系统的建设,以及如何尽快建设一个高速、方便接入的互联网通道。三是如何掌握大数据挖掘技术和培养大数据专业人才。大数据分析需要相关技术与人才的支撑。发达国家的部分IT企业已经初步掌握了一些数据分析预测的关键技术,我国相关企业的技术能力还比较落后。麦肯锡公司预测美国到2018年需要大数据分析人才40多万,人才缺口将达10多万。我国刚刚引入大数据概念,人才匮乏问题更加突出。四是如何避免未来出现大数据产业重复建设甚至产能过剩问题。对于热度正高的大数据产业,如何避免因政府不当干预导致这些问题重演,是对我国当前区域竞争下产业发展体制的一个挑战。
总之,面对社会各界的“大数据”热,应理性分析、冷静观察,扎实做好几个方面的基础性工作。
第一,不必急于出台战略性规划和设立产业专项资金。国内的IT企业和地方政府已经意识到大数据产业的发展前景,对发展大数据应用有着较大热情。某些城市已经启动了大数据发展战略,计划到2017年形成至少500亿元的产业规模。在这种情况下,以规划和专项资金等方式进行鼓励,有可能扭曲正常的市场行为,甚至催生泡沫。
第二,合理改造、建设和布局IT基础设施。对现有的传统数据中心及大量的旧服务器资源,可以通过建立虚拟数据中心或进行就近合并等方式进行改造利用,探索如何通过虚拟化技术和云计算平台管理软件来提高利用效率。对新建的大规模云计算数据中心应进行统筹、合理布局,协调不同省市之间加强互补合作,将能源和气候因素作为项目建设的重要条件,保证经济上的合理性。按照网络建设适度超前于产业发展的原则,加快“宽带普及提速工程”的推进速度,尽快解决大数据应用发展的网络带宽瓶颈。
第三,资助大数据竞争前技术的研究,培养大数据分析人才。在现有政府科技计划中,适度安排项目资金支持大数据关键技术的研发,重点在于竞争前技术,鼓励企业牵头或参与承担。人才培养应从高等教育和企业技术人员再培训两个方面入手,允许大学设立大数据相关专业并进行招生,鼓励地方政府出台关于大数据技术人才培训的相关政策。
此外,还要推动数据隐私保护和公共机构信息公开等立法修法工作。目前,《关于加强网络信息保护的决定》已经通过,应在此基础上继续完善个人隐私保护的相关立法,同时还要推动政府及公益性机构信息公开,使更多的可公开数据得到合理应用。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据分析、后端开发、业务运维等工作中,SQL语句是操作数据库的核心工具。面对复杂的表结构、多表关联逻辑及灵活的查询需求, ...
2026-01-26支持向量机(SVM)作为机器学习中经典的分类算法,凭借其在小样本、高维数据场景下的优异泛化能力,被广泛应用于图像识别、文本 ...
2026-01-26在数字化浪潮下,数据分析已成为企业决策的核心支撑,而CDA数据分析师作为标准化、专业化的数据人才代表,正逐步成为连接数据资 ...
2026-01-26数据分析的核心价值在于用数据驱动决策,而指标作为数据的“载体”,其选取的合理性直接决定分析结果的有效性。选对指标能精准定 ...
2026-01-23在MySQL查询编写中,我们习惯按“SELECT → FROM → WHERE → ORDER BY”的语法顺序组织语句,直觉上认为代码顺序即执行顺序。但 ...
2026-01-23数字化转型已从企业“可选项”升级为“必答题”,其核心本质是通过数据驱动业务重构、流程优化与模式创新,实现从传统运营向智能 ...
2026-01-23CDA持证人已遍布在世界范围各行各业,包括世界500强企业、顶尖科技独角兽、大型金融机构、国企事业单位、国家行政机关等等,“CDA数据分析师”人才队伍遵守着CDA职业道德准则,发挥着专业技能,已成为支撑科技发展的核心力量。 ...
2026-01-22在数字化时代,企业积累的海量数据如同散落的珍珠,而数据模型就是串联这些珍珠的线——它并非简单的数据集合,而是对现实业务场 ...
2026-01-22在数字化运营场景中,用户每一次点击、浏览、交互都构成了行为轨迹,这些轨迹交织成海量的用户行为路径。但并非所有路径都具备业 ...
2026-01-22在数字化时代,企业数据资产的价值持续攀升,数据安全已从“合规底线”升级为“生存红线”。企业数据安全管理方法论以“战略引领 ...
2026-01-22在SQL数据分析与业务查询中,日期数据是高频处理对象——订单创建时间、用户注册日期、数据统计周期等场景,都需对日期进行格式 ...
2026-01-21在实际业务数据分析中,单一数据表往往无法满足需求——用户信息存储在用户表、消费记录在订单表、商品详情在商品表,想要挖掘“ ...
2026-01-21在数字化转型浪潮中,企业数据已从“辅助资源”升级为“核心资产”,而高效的数据管理则是释放数据价值的前提。企业数据管理方法 ...
2026-01-21在数字化商业环境中,数据已成为企业优化运营、抢占市场、规避风险的核心资产。但商业数据分析绝非“堆砌数据、生成报表”的简单 ...
2026-01-20定量报告的核心价值是传递数据洞察,但密密麻麻的表格、复杂的计算公式、晦涩的数值罗列,往往让读者望而却步,导致核心信息被淹 ...
2026-01-20在CDA(Certified Data Analyst)数据分析师的工作场景中,“精准分类与回归预测”是高频核心需求——比如预测用户是否流失、判 ...
2026-01-20在建筑工程造价工作中,清单汇总分类是核心环节之一,尤其是针对楼梯、楼梯间这类包含多个分项工程(如混凝土浇筑、钢筋制作、扶 ...
2026-01-19数据清洗是数据分析的“前置必修课”,其核心目标是剔除无效信息、修正错误数据,让原始数据具备准确性、一致性与可用性。在实际 ...
2026-01-19在CDA(Certified Data Analyst)数据分析师的日常工作中,常面临“无标签高维数据难以归类、群体规律模糊”的痛点——比如海量 ...
2026-01-19在数据仓库与数据分析体系中,维度表与事实表是构建结构化数据模型的核心组件,二者如同“骨架”与“血肉”,协同支撑起各类业务 ...
2026-01-16