京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据:开放共享是政府治理抓手
大数据被喻为“金矿”、“石油”,大数据的价值被业界公认为无价,然而怎么用大数据,怎么发挥大数据的价值,业界众口纷纭,到现在为止也没见到大数据究竟产生了多大价值。
大数据无法发挥其巨大价值,有技术、应用、机制、法律法规等多方面的原因。工信部赛迪智库软件所所长安晖认为,很多人感觉大数据的发展知易行难,知道其有巨大价值,但不清晰具体可行的发展路径,也面临很多不知道如何解决的问题。许多地方的大数据文件之所以难以落地也缘于此。
而现在,《纲要》通过了国务院常务会议讨论并即将发布,这意味着今后我国地方政府和企业在如何发展大数据方面有了指导性文件。安晖告诉《中国电子报》记者,《纲要》在制定过程中,坚持需求导向、问题导向,围绕经济社会发展的迫切需求以及数据资源的积累建设不足、公共数据开放共享不足、产业基础薄弱、应用模式不成熟、体制机制与法规政策不适应大数据发展等关键核心问题,提出了大数据发展的若干重点方向、重点领域、重点任务乃至具体的重点工作。这种全面分析、整体考虑、系统解决的方法,有助于统一各方面意愿与行动,集中合力实现重点突破,加速我国大数据发展与应用步伐。
曙光高级副总裁聂华表示赞同,他认为,政府开放大数据对企业是很好的消息。虽然《纲要》没有提出具体如何解决规章制度、规范问题,但是明确了方向,对政府行政体制改革、对企业利用大数据提供服务和应用于生产、对民众利用大数据改善生活都有促进作用。
在安晖看来,《纲要》的出台,标志着我国大数据规划政策体系进一步健全完善。大数据的发展需要做好顶层规划设计,反过来,国家层面发展战略的缺失一直被视为制约我国大数据发展的关键问题之一。今年以来,《国务院关于促进云计算创新发展培育信息产业新业态的意见》和《国务院办公厅关于运用大数据加强对市场主体服务和监管的若干意见》等文件的出台,都可以视为国家在大数据领域的总体发展思路的部分体现。《纲要》的发布,则提供了更加全面的顶层规划设计。这些文件和已启动制定的《大数据产业“十三五”发展规划》等文件一起,将有望组成较为完备的规划政策体系。
核心和难点在数据开放
政府部门是大数据的“富矿”,因为据称政府部门掌握的数据大约占据了九成。如何开放政府部门数据,使之服务于大数据应用,是推动大数据发展的第一道槛。对此,《纲要》的第一个要点提出优先推动民生领域政府数据开放,就是回应了政府部门数据开放的问题。
然而,政府数据开放,会那么容易吗?聂华指出,《纲要》的核心是政府信息的共享和开放,问题的核心也来自于此。无论是智慧城市建设还是政务信息化,开放政府数据已经讲了很久,大家也公认这个方向。
但是政府开放数据也面临问题,例如,当开放的数据被发现有错误时,那么第一轮开放数据的部门就承担了责任,给该部门造成负面影响,往往会影响它的业绩评价和考核。政府部门开放数据的时候就有顾忌。另外,数据开放的相关措施和规范没有建立起来。如果开放的数据引起泄密事件、社会波动或其他政治事件,数据所有方需要承担责任。而不开放数据的一方,也没有对他们的惩罚机制。这就导致数据开放方产生顾虑,不开放或是晚点开放,也不会主动去开放,所以在具体操作层面上还存在困难与障碍。
开放数据除了可能给开放的政府一方带来风险之外,数据的治理也是他们考虑开放的一个难题。
中关村大数据产业联盟秘书长赵国栋告诉《中国电子报》记者,政府开放数据、实现数据共享是政府深化治理的重要抓手。如何实现数据开放共享,是数据治理的范畴,而数据治理和政府治理紧密相关。如果政府想提高治理水平,就需要提高数据治理水平。数据治理包含数据孤岛、数据割据和数据质量问题。数据割据简单地说是政府部门之间将数据看作自己的资产,而不是看作社会资源和公共资源,这主要是由部门割据造成,以及制度、法规不完善导致;数据孤岛的表现是数据不互联互通,由技术、系统等问题产生;数据质量问题简单说是数据不能反映真实情况。
李克强总理也着重强调解决数据治理问题,提出数据共享,就是要破除数据孤岛、数据割据,实现数据的互联互通。着重解决数据治理问题也就是着重解决政府治理面临的难题。
目前我国一些地方政府正在积极推动政府部门大数据的开放,例如贵阳成立了大数据交易所,沈阳成立了大数据公司,中关村也在探讨如何让数据上市交易。
治理和安全需要法规完善
作为企业一方,在政府在大数据上进行作为时,企业也会相应有所作为。阿里云总裁胡晓明告诉《中国电子报》记者,阿里云正在积极将自身的云计算和大数据能力开放给政府和企业。以阿里云同贵州省政府合作的“云上贵州”为例,阿里云帮助政府搭建了云计算平台,形成对数据的统一管理。这样政府不但节省了IT成本,还实现了数据的集中,为未来政府开放数据奠定了基础。
不过,企业和政府合作过程中数据安全风险与责任的划分目前并不清晰,对于《纲要》中提倡的以企业为主体、以市场为导向、以应用为方向的发展路径,产业界在实施落地时仍会面临障碍。
聂华直言,在数据利用上,鼓励以企业为主体,由企业牵头塑造大数据气氛,但其实随着数据量的增多,敏感性、安全性都会随之而来,由量变产生质变,会带来隐私问题、安全问题。根据以往经验,通过大数据比对,往往能看到一些不应该公开的信息。例如谷歌地图、百度地图拍下的信息,都有可能侵犯个人隐私、带来政府安全隐患。尤其是政府数据的共识性、价值密度都很高,如果贸然鼓励企业主导开发大数据应用,如果产生安全隐私问题,又没有相关法律法规保障,那么无论对于企业还是数据所有方,都是伤害。
可是,如果数据不被大家所用,不应用到行业,效果也会打折扣。赵国栋就表示,任何行业都会产生大数据,例如物流、电信、金融、交易、旅游等等,有大数据的地方就能产生行业应用,也能服务于该行业,所以大数据是各行各业的一个抓手,抓好这个行业其实对传统行业的带动作用非常明显。很多企业在决定战略转型时,一个典型的选择是以数据资产为核心的相关产业多元化,所以大数据也是影响企业决策的一部分。另外,大数据产业对推动区域经济的价值作用正在显现,大数据涉及的广泛的产业生态和生产性服务业可以形成一个有机的整合,是推动区域经济发展最重要的抓手。
总结下来,目前大数据应用面临的问题,一个是如何应用的问题。北京大学计算机系教授陈钟告诉《中国电子报》记者,我国在数据应用方面长期有欠账:一方面是数据公开问题,另一方面是数据应用的跳跃问题。我国在大数据应用的技术、意识观念上都有欠缺,需要一步一步夯实,让真正懂数据的人去做应用。
另一个是数据安全问题。陈钟表示,大数据涉及个人隐私,也涉及一些敏感性数据,需要分类治理公共的、敏感性的或是有隐私的数据。中国对于数据保护的法律法规还需要完善,购买公共数据做大数据应用服务,也需要法律支撑。
聂华对此表示赞同,他说:“数据安全是个大问题。虽然国家部门出台了相关标准,做了一定保障,但是安全是个永恒的话题,包括服务商的背景、技术实力、产品实力、营销市场体系等等,都会影响到整个数据的开放和应用。保障信息安全,需要完善法律法规,需要国家在技术上有更多的投入。”
CDA学员免费下载查看报告全文:2026全球数智化人才指数报告【CDA数据科学研究院】.pdf
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数字化时代,数据已成为企业决策的核心驱动力,数据分析与数据挖掘作为解锁数据价值的关键手段,广泛应用于互联网、金融、医疗 ...
2026-04-17在数据处理、后端开发、报表生成与自动化脚本中,将 SQL 查询结果转换为字符串是一项高频且实用的操作。无论是拼接多行数据为逗 ...
2026-04-17面对一份上万行的销售明细表,要快速回答“哪个地区卖得最好”“哪款产品增长最快”“不同客户类型的购买力如何”——这些看似复 ...
2026-04-17数据分析师一天的工作,80% 的时间围绕表格结构数据展开。从一张销售明细表到一份完整的分析报告,表格结构数据贯穿始终。但你真 ...
2026-04-16在机器学习无监督学习领域,Kmeans聚类因其原理简洁、计算高效、可扩展性强的优势,成为数据聚类任务中的主流算法,广泛应用于用 ...
2026-04-16在机器学习建模实践中,特征工程是决定模型性能的核心环节之一。面对高维数据集,冗余特征、无关特征不仅会增加模型训练成本、延 ...
2026-04-16在数字化时代,用户是产品的核心资产,用户运营的本质的是通过科学的指标监测、分析与优化,实现“拉新、促活、留存、转化、复购 ...
2026-04-15在企业数字化转型、系统架构设计、数据治理与AI落地过程中,数据模型、本体模型、业务模型是三大核心基础模型,三者相互支撑、各 ...
2026-04-15数据分析师的一天,80%的时间花在表格数据上,但80%的坑也踩在表格数据上。 如果你分不清数值型和文本型的区别,不知道数据从哪 ...
2026-04-15在人工智能与机器学习落地过程中,模型质量直接决定了应用效果的优劣——无论是分类、回归、生成式模型,还是推荐、预测类模型, ...
2026-04-14在Python网络编程、接口测试、爬虫开发等场景中,HTTP请求的发送与响应处理是核心需求。Requests库作为Python生态中最流行的HTTP ...
2026-04-14 很多新人学完Python、SQL,拿到一张Excel表还是不知从何下手。 其实,90%的商业分析问题,都藏在表格的结构里。 ” 引言:为 ...
2026-04-14在回归分析中,因子(即自变量)的筛选是构建高效、可靠回归模型的核心步骤——实际分析场景中,往往存在多个候选因子,其中部分 ...
2026-04-13在机器学习模型开发过程中,过拟合是制约模型泛化能力的核心痛点——模型过度学习训练数据中的噪声与偶然细节,导致在训练集上表 ...
2026-04-13在数据驱动商业升级的今天,商业数据分析已成为企业精细化运营、科学决策的核心手段,而一套规范、高效的商业数据分析总体流程, ...
2026-04-13主讲人简介 张冲,海归统计学硕士,CDA 认证数据分析师,前云南白药集团资深数据分析师,自媒体 Python 讲师,全网课程播放量破 ...
2026-04-13在数据可视化与业务分析中,同比分析是衡量业务发展趋势、识别周期波动的核心手段,其核心逻辑是将当前周期数据与上年同期数据进 ...
2026-04-13在机器学习模型的落地应用中,预测精度并非衡量模型可靠性的唯一标准,不确定性分析同样不可或缺。尤其是在医疗诊断、自动驾驶、 ...
2026-04-10数据本身是沉默的,唯有通过有效的呈现方式,才能让其背后的规律、趋势与价值被看见、被理解、被运用。统计制图(数据可视化)作 ...
2026-04-10在全球化深度发展的今天,跨文化传播已成为连接不同文明、促进多元共生的核心纽带,其研究核心围绕“信息传递、文化解读、意义建 ...
2026-04-09