
大数据:开放共享是政府治理抓手
大数据被喻为“金矿”、“石油”,大数据的价值被业界公认为无价,然而怎么用大数据,怎么发挥大数据的价值,业界众口纷纭,到现在为止也没见到大数据究竟产生了多大价值。
大数据无法发挥其巨大价值,有技术、应用、机制、法律法规等多方面的原因。工信部赛迪智库软件所所长安晖认为,很多人感觉大数据的发展知易行难,知道其有巨大价值,但不清晰具体可行的发展路径,也面临很多不知道如何解决的问题。许多地方的大数据文件之所以难以落地也缘于此。
而现在,《纲要》通过了国务院常务会议讨论并即将发布,这意味着今后我国地方政府和企业在如何发展大数据方面有了指导性文件。安晖告诉《中国电子报》记者,《纲要》在制定过程中,坚持需求导向、问题导向,围绕经济社会发展的迫切需求以及数据资源的积累建设不足、公共数据开放共享不足、产业基础薄弱、应用模式不成熟、体制机制与法规政策不适应大数据发展等关键核心问题,提出了大数据发展的若干重点方向、重点领域、重点任务乃至具体的重点工作。这种全面分析、整体考虑、系统解决的方法,有助于统一各方面意愿与行动,集中合力实现重点突破,加速我国大数据发展与应用步伐。
曙光高级副总裁聂华表示赞同,他认为,政府开放大数据对企业是很好的消息。虽然《纲要》没有提出具体如何解决规章制度、规范问题,但是明确了方向,对政府行政体制改革、对企业利用大数据提供服务和应用于生产、对民众利用大数据改善生活都有促进作用。
在安晖看来,《纲要》的出台,标志着我国大数据规划政策体系进一步健全完善。大数据的发展需要做好顶层规划设计,反过来,国家层面发展战略的缺失一直被视为制约我国大数据发展的关键问题之一。今年以来,《国务院关于促进云计算创新发展培育信息产业新业态的意见》和《国务院办公厅关于运用大数据加强对市场主体服务和监管的若干意见》等文件的出台,都可以视为国家在大数据领域的总体发展思路的部分体现。《纲要》的发布,则提供了更加全面的顶层规划设计。这些文件和已启动制定的《大数据产业“十三五”发展规划》等文件一起,将有望组成较为完备的规划政策体系。
核心和难点在数据开放
政府部门是大数据的“富矿”,因为据称政府部门掌握的数据大约占据了九成。如何开放政府部门数据,使之服务于大数据应用,是推动大数据发展的第一道槛。对此,《纲要》的第一个要点提出优先推动民生领域政府数据开放,就是回应了政府部门数据开放的问题。
然而,政府数据开放,会那么容易吗?聂华指出,《纲要》的核心是政府信息的共享和开放,问题的核心也来自于此。无论是智慧城市建设还是政务信息化,开放政府数据已经讲了很久,大家也公认这个方向。
但是政府开放数据也面临问题,例如,当开放的数据被发现有错误时,那么第一轮开放数据的部门就承担了责任,给该部门造成负面影响,往往会影响它的业绩评价和考核。政府部门开放数据的时候就有顾忌。另外,数据开放的相关措施和规范没有建立起来。如果开放的数据引起泄密事件、社会波动或其他政治事件,数据所有方需要承担责任。而不开放数据的一方,也没有对他们的惩罚机制。这就导致数据开放方产生顾虑,不开放或是晚点开放,也不会主动去开放,所以在具体操作层面上还存在困难与障碍。
开放数据除了可能给开放的政府一方带来风险之外,数据的治理也是他们考虑开放的一个难题。
中关村大数据产业联盟秘书长赵国栋告诉《中国电子报》记者,政府开放数据、实现数据共享是政府深化治理的重要抓手。如何实现数据开放共享,是数据治理的范畴,而数据治理和政府治理紧密相关。如果政府想提高治理水平,就需要提高数据治理水平。数据治理包含数据孤岛、数据割据和数据质量问题。数据割据简单地说是政府部门之间将数据看作自己的资产,而不是看作社会资源和公共资源,这主要是由部门割据造成,以及制度、法规不完善导致;数据孤岛的表现是数据不互联互通,由技术、系统等问题产生;数据质量问题简单说是数据不能反映真实情况。
李克强总理也着重强调解决数据治理问题,提出数据共享,就是要破除数据孤岛、数据割据,实现数据的互联互通。着重解决数据治理问题也就是着重解决政府治理面临的难题。
目前我国一些地方政府正在积极推动政府部门大数据的开放,例如贵阳成立了大数据交易所,沈阳成立了大数据公司,中关村也在探讨如何让数据上市交易。
治理和安全需要法规完善
作为企业一方,在政府在大数据上进行作为时,企业也会相应有所作为。阿里云总裁胡晓明告诉《中国电子报》记者,阿里云正在积极将自身的云计算和大数据能力开放给政府和企业。以阿里云同贵州省政府合作的“云上贵州”为例,阿里云帮助政府搭建了云计算平台,形成对数据的统一管理。这样政府不但节省了IT成本,还实现了数据的集中,为未来政府开放数据奠定了基础。
不过,企业和政府合作过程中数据安全风险与责任的划分目前并不清晰,对于《纲要》中提倡的以企业为主体、以市场为导向、以应用为方向的发展路径,产业界在实施落地时仍会面临障碍。
聂华直言,在数据利用上,鼓励以企业为主体,由企业牵头塑造大数据气氛,但其实随着数据量的增多,敏感性、安全性都会随之而来,由量变产生质变,会带来隐私问题、安全问题。根据以往经验,通过大数据比对,往往能看到一些不应该公开的信息。例如谷歌地图、百度地图拍下的信息,都有可能侵犯个人隐私、带来政府安全隐患。尤其是政府数据的共识性、价值密度都很高,如果贸然鼓励企业主导开发大数据应用,如果产生安全隐私问题,又没有相关法律法规保障,那么无论对于企业还是数据所有方,都是伤害。
可是,如果数据不被大家所用,不应用到行业,效果也会打折扣。赵国栋就表示,任何行业都会产生大数据,例如物流、电信、金融、交易、旅游等等,有大数据的地方就能产生行业应用,也能服务于该行业,所以大数据是各行各业的一个抓手,抓好这个行业其实对传统行业的带动作用非常明显。很多企业在决定战略转型时,一个典型的选择是以数据资产为核心的相关产业多元化,所以大数据也是影响企业决策的一部分。另外,大数据产业对推动区域经济的价值作用正在显现,大数据涉及的广泛的产业生态和生产性服务业可以形成一个有机的整合,是推动区域经济发展最重要的抓手。
总结下来,目前大数据应用面临的问题,一个是如何应用的问题。北京大学计算机系教授陈钟告诉《中国电子报》记者,我国在数据应用方面长期有欠账:一方面是数据公开问题,另一方面是数据应用的跳跃问题。我国在大数据应用的技术、意识观念上都有欠缺,需要一步一步夯实,让真正懂数据的人去做应用。
另一个是数据安全问题。陈钟表示,大数据涉及个人隐私,也涉及一些敏感性数据,需要分类治理公共的、敏感性的或是有隐私的数据。中国对于数据保护的法律法规还需要完善,购买公共数据做大数据应用服务,也需要法律支撑。
聂华对此表示赞同,他说:“数据安全是个大问题。虽然国家部门出台了相关标准,做了一定保障,但是安全是个永恒的话题,包括服务商的背景、技术实力、产品实力、营销市场体系等等,都会影响到整个数据的开放和应用。保障信息安全,需要完善法律法规,需要国家在技术上有更多的投入。”
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在神经网络模型设计中,“隐藏层层数” 是决定模型能力与效率的核心参数之一 —— 层数过少,模型可能 “欠拟合”(无法捕捉数据 ...
2025-10-14在数字化浪潮中,数据分析师已成为企业 “从数据中挖掘价值” 的核心角色 —— 他们既要能从海量数据中提取有效信息,又要能将分 ...
2025-10-14在企业数据驱动的实践中,“指标混乱” 是最常见的痛点:运营部门说 “复购率 15%”,产品部门说 “复购率 8%”,实则是两者对 ...
2025-10-14在手游行业,“次日留存率” 是衡量一款游戏生死的 “第一道关卡”—— 它不仅反映了玩家对游戏的初始接受度,更直接决定了后续 ...
2025-10-13分库分表,为何而生? 在信息技术发展的早期阶段,数据量相对较小,业务逻辑也较为简单,单库单表的数据库架构就能够满足大多数 ...
2025-10-13在企业数字化转型过程中,“数据孤岛” 是普遍面临的痛点:用户数据散落在 APP 日志、注册系统、客服记录中,订单数据分散在交易 ...
2025-10-13在数字化时代,用户的每一次行为 —— 从电商平台的 “浏览→加购→购买”,到视频 APP 的 “打开→搜索→观看→收藏”,再到银 ...
2025-10-11在机器学习建模流程中,“特征重要性分析” 是连接 “数据” 与 “业务” 的关键桥梁 —— 它不仅能帮我们筛选冗余特征、提升模 ...
2025-10-11在企业的数据体系中,未经分类的数据如同 “杂乱无章的仓库”—— 用户行为日志、订单记录、商品信息混杂存储,CDA(Certified D ...
2025-10-11在 SQL Server 数据库操作中,“数据类型转换” 是高频需求 —— 无论是将字符串格式的日期转为datetime用于筛选,还是将数值转 ...
2025-10-10在科研攻关、工业优化、产品开发中,正交试验(Orthogonal Experiment)因 “用少量试验覆盖多因素多水平组合” 的高效性,成为 ...
2025-10-10在企业数据量从 “GB 级” 迈向 “PB 级” 的过程中,“数据混乱” 的痛点逐渐从 “隐性问题” 变为 “显性瓶颈”:各部门数据口 ...
2025-10-10在深度学习中,“模型如何从错误中学习” 是最关键的问题 —— 而损失函数与反向传播正是回答这一问题的核心技术:损失函数负责 ...
2025-10-09本文将从 “检验本质” 切入,拆解两种方法的核心适用条件、场景边界与实战选择逻辑,结合医学、工业、教育领域的案例,让你明确 ...
2025-10-09在 CDA 数据分析师的日常工作中,常会遇到这样的困惑:某电商平台 11 月 GMV 同比增长 20%,但究竟是 “长期趋势自然增长”,还 ...
2025-10-09Pandas 选取特定值所在行:6 类核心方法与实战指南 在使用 pandas 处理结构化数据时,“选取特定值所在的行” 是最高频的操作之 ...
2025-09-30球面卷积神经网络(SCNN) 为解决这一痛点,球面卷积神经网络(Spherical Convolutional Neural Network, SCNN) 应运而生。它通 ...
2025-09-30在企业日常运营中,“未来会怎样” 是决策者最关心的问题 —— 电商平台想知道 “下月销量能否达标”,金融机构想预判 “下周股 ...
2025-09-30Excel 能做聚类分析吗?基础方法、进阶技巧与场景边界 在数据分析领域,聚类分析是 “无监督学习” 的核心技术 —— 无需预设分 ...
2025-09-29XGBoost 决策树:原理、优化与工业级实战指南 在机器学习领域,决策树因 “可解释性强、处理非线性关系能力突出” 成为基础模型 ...
2025-09-29