京公网安备 11010802034615号
经营许可证编号:京B2-20210330
我国大数据产业发展态势分析及建议
我国高度重视大数据的战略意义和数据资源对社会经济发展的积极作用,国务院于2015年出台了《促进大数据发展行动纲要》,并将“实施国家大数据战略,推进数据资源开放共享”纳入“十三五”期间规划和建设的重要目标。目前国内大数据产业发展已初具规模,但尚未形成产业界定共识。本文首先就大数据产业的核心要素进行探讨,然后从核心要素展开阐述我国大数据产业发展的若干特点,最后结合发展现状和问题提出相关策略建议。
一、大数据产业的核心要素
普遍意义上来讲,大数据产业是以数据及数据所蕴含的信息价值为核心资源所构成的生态环境,它包含了与大数据管理和价值实现相关的企业、行业机构等社会主体的经济活动集合。遵照产业定义的通用原则,产业各环节的参与实体应能够提供可交付的产品和服务,并形成上下游产业链供需关系。在此基础上,依据数据价值的提升路径和IT领域的产品布局,我们将大数据产业的核心要素归纳为数据资源、数据基础能力、数据分析和展示、数据应用几个重要组成部分。
图1. 大数据产业核心要素示意图1
其中,数据资源部分负责原始数据的供给和交换,是数据资产作为生产要素的直接表现,根据数据来源的不同,可以细分为数据资源提供者和数据交易平台两种角色;数据基础能力部分负责与数据生产加工相关的基础设施和技术要素供应,为数据加工和价值提升提供生产工具,主要包括数据存储、数据处理和数据库等多个角色;数据分析和展示部分负责数据隐含价值的挖掘、数据关联分析和可视化展现等,是智力要素在数据价值中的集中体现,包括传统意义上的BI、可视化和通用数据分析工具,以及面向非结构化数据提供的语音、图像等媒体识别服务;数据应用部分根据数据分析和加工的结果,面向电商、金融、交通等细分行业提供精准营销、信用评估、出行引导等企业或公众服务。
二、我国大数据产业发展现状和特点
自2013年大数据的概念迅速普及,国内大数据领域在电信、互联网、金融、电商等信息化领先行业的引导和带动下,聚集了BAT等龙头企业和数百家中小及初创企业,在大数据产业的主要环节完成了初步布局,产品和服务供应链能够满足基本数据生产加工的全生命周期覆盖。经过两三年的持续发展,我国的大数据产业呈现出以下几个发展特点。
数据资源层,开放主体集中在信息化基础较好行业及地区,并呈现服务化趋势。随着大数据产业中数据资源参与主体的逐渐增多,我国的数据开放程度得到了普遍提升。一方面,数据开放的主体集中在部分信息化基础较好行业及经济发达地区,如互联网、交通出行、教育科研行业等,都出现了相应的数据开放企业和平台。政府推动的公共信息资源开放网站也主要由信息经济较发达地区先行先试,并逐渐向周边省市辐射扩散。另一方面,第三方数据交易平台不断涌现,填补了居间服务的市场空白。目前全国范围内已建成及正在筹建的地方数据交易机构达到十余家。一些早期的数据交易平台逐渐从单一的居间服务商向数据资源综合服务商转型。
数据基础能力层,参与主体基本完成云时代向数据时代的转型升级。随着大规模数据存储和处理能力需求的快速增长,以BAT、华为、浪潮等为代表的云计算服务提供商,根据自身的原始积累和优势资源完成向数据驱动企业的战略转型。百度凭借其长期积累的用户搜索记录推出了百度数据开放平台,通过百度搜索服务提供“即搜即得”的高效数据展现。阿里云从基础的弹性资源供给逐渐扩展服务类型,研发并提供了支持PB级数据存储的分布式关系型数据库(PetaData)等一系列数据支撑产品。华为的分布式存储管理系统FusionStorage为异构海量数据的存储管理提供了弹性可扩展的技术保障。
数据分析以及应用层,中小和初创企业积极占领战略高地。由于缺失原始数据资产和先期市场份额,中小企业,特别是初创企业集中布局在数据分析和数据应用等低基础产业环节,投融资形势异常火爆。据中关村数据产业联盟统计数据显示,中关村从事数据分析和数据应用的企业合计超过110家,占总数2/3以上。投融资方面,据不完全统计2015年在国内融资的大数据创业公司超过50家,总融资金额超过50亿人民币,其中从事数据分析和行业数据应用的创业公司近40家,占75%以上。2016年上半年,数据分析和应用两个领域的创业公司融资情况占据了主流,数量为17家,占比达到70%。
此外,硬件和软件相互渗透的两种商业模式并举并行,为大数据产业带来新机遇。为了更广泛地覆盖数据生产加工流程,延长其产品和服务在数据生命周期中的作用范围,大数据产业的参与企业逐渐打破硬件和软件的产品界限,形成了“硬件带动软件”和“软件带动硬件”两种新型商业模式。浪潮推出的SmartRack系列整机柜服务器,针对深度学习应用、社交数据存储、热数据处理等不同数据处理场景制定了多种混搭架构方案,以一体机的方式实现硬件设施和软件管理的集成交付。阿里巴巴发布的数加平台率先探索以“软件带动硬件”的市场营销模式,该平台通过提供数据计算引擎、机器学习等开放服务,将阿里云的计算、存储等多种资源有机地组织在一起形成解决方案,有效扩展阿里云在实际生产环境中的部署推广途径。
三、我国大数据产业发展建议
把握源头,强化数据质量管理。目前数据资源开放在开放范围、开发利用方式、数据可用性等方面仍存在局限性和不足。截止2016年5月,全国共有九个省份/直辖市开通了区域级数据开放网站。虽然与去年同期相比,平台数量有所增加,但大多数地区仍面临数据开放格式不一致、可机读性较差,更新频率较低等现实问题。部分地方或第三方数据交易平台在流通效率、质量管理方面良莠不齐,特别是不同行业数据维度不统一、语义不协同等共性问题制约了交易市场的规模化发展。为推动大数据产业发展,需要进一步把握好数据源头,推动各方不断加强自身数据能力建设,做优存量、做大增量,加快完善相关配套措施确保隐私和信息安全。同时鼓励参与主体共同推动数据标准化进程,健全数据交易规范,探索数据资产定价机制,以各行业多样化应用需求撬动数据交易市场巨大发展潜力。
细化分工,关注数据技术过渡领域。与美国等数据产业发达国家相比,我国大数据产业的短板仍较明显,数据加工处理服务、数据库技术和通用数据分析工具等基础性通用数据技术差距较大,同时市场主体数量少、自主知识产权把控能力低等现状导致未来发展动力不足。传统行业和企业对数据分析应用具有巨大需求潜力,但其数据资源多以结构化为主。原有结构化数据和新增非结构化数据之间的互访问操作和融合管理成为新式共性技术要素,是抢占未来主流市场的关键技术机遇点。美国等技术先驱国家的产业版图已完成了技术过渡领域的初步布局,我国产业参与主体也应考虑进一步细化市场分工,形成专业性强、衔接紧密的产业新生态,并积极加大过渡时期的技术研发力度,实现数据过渡期与发达国家的同步发展。
强化合作,探索新型商业模式。大数据产业是技术密集型产业,同时也是业务驱动为主的实用型产业。就数据分析和运用过程中需解决的共性基础研究问题,欧美等数据产业发达国家通常采用以开源社区先行的开放合作模式,采用“众包”思想不断完善系统架构和产品服务功能,提供更为通用和普适的技术解决方案。经过大量企业在生产实践中的优胜劣汰自由选择,不断成熟和完善的开源产品逐渐从免费提供向企业化盈利的商业模式进行演变。相比之下,我国数据产业的参与主体在开源社区中的贡献仍然较低,企业间合作、国际间合作的参与热情有待提高。应借鉴国外企业的成功经验,以开源产品和服务为基础,提供定制化和深度支撑的新型商业模式,同时也能够为中小企业和初创企业参与大数据产业提供新的发展思路。
1很多大数据企业的主营业务涵盖某一核心要素中的多类或横跨多个核心要素,图中示意仅列举了代表企业的典型服务或产品。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在神经网络模型搭建中,“最后一层是否添加激活函数”是新手常困惑的关键问题——有人照搬中间层的ReLU激活,导致回归任务输出异 ...
2025-12-05在机器学习落地过程中,“模型准确率高但不可解释”“面对数据噪声就失效”是两大核心痛点——金融风控模型若无法解释决策依据, ...
2025-12-05在CDA(Certified Data Analyst)数据分析师的能力模型中,“指标计算”是基础技能,而“指标体系搭建”则是区分新手与资深分析 ...
2025-12-05在回归分析的结果解读中,R方(决定系数)是衡量模型拟合效果的核心指标——它代表因变量的变异中能被自变量解释的比例,取值通 ...
2025-12-04在城市规划、物流配送、文旅分析等场景中,经纬度热力图是解读空间数据的核心工具——它能将零散的GPS坐标(如外卖订单地址、景 ...
2025-12-04在CDA(Certified Data Analyst)数据分析师的指标体系中,“通用指标”与“场景指标”并非相互割裂的两个部分,而是支撑业务分 ...
2025-12-04每到“双十一”,电商平台的销售额会迎来爆发式增长;每逢冬季,北方的天然气消耗量会显著上升;每月的10号左右,工资发放会带动 ...
2025-12-03随着数字化转型的深入,企业面临的数据量呈指数级增长——电商的用户行为日志、物联网的传感器数据、社交平台的图文视频等,这些 ...
2025-12-03在CDA(Certified Data Analyst)数据分析师的工作体系中,“指标”是贯穿始终的核心载体——从“销售额环比增长15%”的业务结论 ...
2025-12-03在神经网络训练中,损失函数的数值变化常被视为模型训练效果的“核心仪表盘”——初学者盯着屏幕上不断下降的损失值满心欢喜,却 ...
2025-12-02在CDA(Certified Data Analyst)数据分析师的日常工作中,“用部分数据推断整体情况”是高频需求——从10万条订单样本中判断全 ...
2025-12-02在数据预处理的纲量统一环节,标准化是消除量纲影响的核心手段——它将不同量级的特征(如“用户年龄”“消费金额”)转化为同一 ...
2025-12-02在数据驱动决策成为企业核心竞争力的今天,A/B测试已从“可选优化工具”升级为“必选验证体系”。它通过控制变量法构建“平行实 ...
2025-12-01在时间序列预测任务中,LSTM(长短期记忆网络)凭借对时序依赖关系的捕捉能力成为主流模型。但很多开发者在实操中会遇到困惑:用 ...
2025-12-01引言:数据时代的“透视镜”与“掘金者” 在数字经济浪潮下,数据已成为企业决策的核心资产,而CDA数据分析师正是挖掘数据价值的 ...
2025-12-01数据分析师的日常,常始于一堆“毫无章法”的数据点:电商后台导出的零散订单记录、APP埋点收集的无序用户行为日志、传感器实时 ...
2025-11-28在MySQL数据库运维中,“query end”是查询执行生命周期的收尾阶段,理论上耗时极短——主要完成结果集封装、资源释放、事务状态 ...
2025-11-28在CDA(Certified Data Analyst)数据分析师的工具包中,透视分析方法是处理表结构数据的“瑞士军刀”——无需复杂代码,仅通过 ...
2025-11-28在统计分析中,数据的分布形态是决定“用什么方法分析、信什么结果”的底层逻辑——它如同数据的“性格”,直接影响着描述统计的 ...
2025-11-27在电商订单查询、用户信息导出等业务场景中,技术人员常面临一个选择:是一次性查询500条数据,还是分5次每次查询100条?这个问 ...
2025-11-27