京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据:开放共享是政府治理抓手
大数据被喻为“金矿”、“石油”,大数据的价值被业界公认为无价,然而怎么用大数据,怎么发挥大数据的价值,业界众口纷纭,到现在为止也没见到大数据究竟产生了多大价值。
大数据无法发挥其巨大价值,有技术、应用、机制、法律法规等多方面的原因。工信部赛迪智库软件所所长安晖认为,很多人感觉大数据的发展知易行难,知道其有巨大价值,但不清晰具体可行的发展路径,也面临很多不知道如何解决的问题。许多地方的大数据文件之所以难以落地也缘于此。
而现在,《纲要》通过了国务院常务会议讨论并即将发布,这意味着今后我国地方政府和企业在如何发展大数据方面有了指导性文件。安晖告诉《中国电子报》记者,《纲要》在制定过程中,坚持需求导向、问题导向,围绕经济社会发展的迫切需求以及数据资源的积累建设不足、公共数据开放共享不足、产业基础薄弱、应用模式不成熟、体制机制与法规政策不适应大数据发展等关键核心问题,提出了大数据发展的若干重点方向、重点领域、重点任务乃至具体的重点工作。这种全面分析、整体考虑、系统解决的方法,有助于统一各方面意愿与行动,集中合力实现重点突破,加速我国大数据发展与应用步伐。
曙光高级副总裁聂华表示赞同,他认为,政府开放大数据对企业是很好的消息。虽然《纲要》没有提出具体如何解决规章制度、规范问题,但是明确了方向,对政府行政体制改革、对企业利用大数据提供服务和应用于生产、对民众利用大数据改善生活都有促进作用。
在安晖看来,《纲要》的出台,标志着我国大数据规划政策体系进一步健全完善。大数据的发展需要做好顶层规划设计,反过来,国家层面发展战略的缺失一直被视为制约我国大数据发展的关键问题之一。今年以来,《国务院关于促进云计算创新发展培育信息产业新业态的意见》和《国务院办公厅关于运用大数据加强对市场主体服务和监管的若干意见》等文件的出台,都可以视为国家在大数据领域的总体发展思路的部分体现。《纲要》的发布,则提供了更加全面的顶层规划设计。这些文件和已启动制定的《大数据产业“十三五”发展规划》等文件一起,将有望组成较为完备的规划政策体系。
核心和难点在数据开放
政府部门是大数据的“富矿”,因为据称政府部门掌握的数据大约占据了九成。如何开放政府部门数据,使之服务于大数据应用,是推动大数据发展的第一道槛。对此,《纲要》的第一个要点提出优先推动民生领域政府数据开放,就是回应了政府部门数据开放的问题。
然而,政府数据开放,会那么容易吗?聂华指出,《纲要》的核心是政府信息的共享和开放,问题的核心也来自于此。无论是智慧城市建设还是政务信息化,开放政府数据已经讲了很久,大家也公认这个方向。
但是政府开放数据也面临问题,例如,当开放的数据被发现有错误时,那么第一轮开放数据的部门就承担了责任,给该部门造成负面影响,往往会影响它的业绩评价和考核。政府部门开放数据的时候就有顾忌。另外,数据开放的相关措施和规范没有建立起来。如果开放的数据引起泄密事件、社会波动或其他政治事件,数据所有方需要承担责任。而不开放数据的一方,也没有对他们的惩罚机制。这就导致数据开放方产生顾虑,不开放或是晚点开放,也不会主动去开放,所以在具体操作层面上还存在困难与障碍。
开放数据除了可能给开放的政府一方带来风险之外,数据的治理也是他们考虑开放的一个难题。
中关村大数据产业联盟秘书长赵国栋告诉《中国电子报》记者,政府开放数据、实现数据共享是政府深化治理的重要抓手。如何实现数据开放共享,是数据治理的范畴,而数据治理和政府治理紧密相关。如果政府想提高治理水平,就需要提高数据治理水平。数据治理包含数据孤岛、数据割据和数据质量问题。数据割据简单地说是政府部门之间将数据看作自己的资产,而不是看作社会资源和公共资源,这主要是由部门割据造成,以及制度、法规不完善导致;数据孤岛的表现是数据不互联互通,由技术、系统等问题产生;数据质量问题简单说是数据不能反映真实情况。
李克强总理也着重强调解决数据治理问题,提出数据共享,就是要破除数据孤岛、数据割据,实现数据的互联互通。着重解决数据治理问题也就是着重解决政府治理面临的难题。
目前我国一些地方政府正在积极推动政府部门大数据的开放,例如贵阳成立了大数据交易所,沈阳成立了大数据公司,中关村也在探讨如何让数据上市交易。
治理和安全需要法规完善
作为企业一方,在政府在大数据上进行作为时,企业也会相应有所作为。阿里云总裁胡晓明告诉《中国电子报》记者,阿里云正在积极将自身的云计算和大数据能力开放给政府和企业。以阿里云同贵州省政府合作的“云上贵州”为例,阿里云帮助政府搭建了云计算平台,形成对数据的统一管理。这样政府不但节省了IT成本,还实现了数据的集中,为未来政府开放数据奠定了基础。
不过,企业和政府合作过程中数据安全风险与责任的划分目前并不清晰,对于《纲要》中提倡的以企业为主体、以市场为导向、以应用为方向的发展路径,产业界在实施落地时仍会面临障碍。
聂华直言,在数据利用上,鼓励以企业为主体,由企业牵头塑造大数据气氛,但其实随着数据量的增多,敏感性、安全性都会随之而来,由量变产生质变,会带来隐私问题、安全问题。根据以往经验,通过大数据比对,往往能看到一些不应该公开的信息。例如谷歌地图、百度地图拍下的信息,都有可能侵犯个人隐私、带来政府安全隐患。尤其是政府数据的共识性、价值密度都很高,如果贸然鼓励企业主导开发大数据应用,如果产生安全隐私问题,又没有相关法律法规保障,那么无论对于企业还是数据所有方,都是伤害。
可是,如果数据不被大家所用,不应用到行业,效果也会打折扣。赵国栋就表示,任何行业都会产生大数据,例如物流、电信、金融、交易、旅游等等,有大数据的地方就能产生行业应用,也能服务于该行业,所以大数据是各行各业的一个抓手,抓好这个行业其实对传统行业的带动作用非常明显。很多企业在决定战略转型时,一个典型的选择是以数据资产为核心的相关产业多元化,所以大数据也是影响企业决策的一部分。另外,大数据产业对推动区域经济的价值作用正在显现,大数据涉及的广泛的产业生态和生产性服务业可以形成一个有机的整合,是推动区域经济发展最重要的抓手。
总结下来,目前大数据应用面临的问题,一个是如何应用的问题。北京大学计算机系教授陈钟告诉《中国电子报》记者,我国在数据应用方面长期有欠账:一方面是数据公开问题,另一方面是数据应用的跳跃问题。我国在大数据应用的技术、意识观念上都有欠缺,需要一步一步夯实,让真正懂数据的人去做应用。
另一个是数据安全问题。陈钟表示,大数据涉及个人隐私,也涉及一些敏感性数据,需要分类治理公共的、敏感性的或是有隐私的数据。中国对于数据保护的法律法规还需要完善,购买公共数据做大数据应用服务,也需要法律支撑。
聂华对此表示赞同,他说:“数据安全是个大问题。虽然国家部门出台了相关标准,做了一定保障,但是安全是个永恒的话题,包括服务商的背景、技术实力、产品实力、营销市场体系等等,都会影响到整个数据的开放和应用。保障信息安全,需要完善法律法规,需要国家在技术上有更多的投入。”
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在回归分析的结果解读中,R方(决定系数)是衡量模型拟合效果的核心指标——它代表因变量的变异中能被自变量解释的比例,取值通 ...
2025-12-04在城市规划、物流配送、文旅分析等场景中,经纬度热力图是解读空间数据的核心工具——它能将零散的GPS坐标(如外卖订单地址、景 ...
2025-12-04在CDA(Certified Data Analyst)数据分析师的指标体系中,“通用指标”与“场景指标”并非相互割裂的两个部分,而是支撑业务分 ...
2025-12-04每到“双十一”,电商平台的销售额会迎来爆发式增长;每逢冬季,北方的天然气消耗量会显著上升;每月的10号左右,工资发放会带动 ...
2025-12-03随着数字化转型的深入,企业面临的数据量呈指数级增长——电商的用户行为日志、物联网的传感器数据、社交平台的图文视频等,这些 ...
2025-12-03在CDA(Certified Data Analyst)数据分析师的工作体系中,“指标”是贯穿始终的核心载体——从“销售额环比增长15%”的业务结论 ...
2025-12-03在神经网络训练中,损失函数的数值变化常被视为模型训练效果的“核心仪表盘”——初学者盯着屏幕上不断下降的损失值满心欢喜,却 ...
2025-12-02在CDA(Certified Data Analyst)数据分析师的日常工作中,“用部分数据推断整体情况”是高频需求——从10万条订单样本中判断全 ...
2025-12-02在数据预处理的纲量统一环节,标准化是消除量纲影响的核心手段——它将不同量级的特征(如“用户年龄”“消费金额”)转化为同一 ...
2025-12-02在数据驱动决策成为企业核心竞争力的今天,A/B测试已从“可选优化工具”升级为“必选验证体系”。它通过控制变量法构建“平行实 ...
2025-12-01在时间序列预测任务中,LSTM(长短期记忆网络)凭借对时序依赖关系的捕捉能力成为主流模型。但很多开发者在实操中会遇到困惑:用 ...
2025-12-01引言:数据时代的“透视镜”与“掘金者” 在数字经济浪潮下,数据已成为企业决策的核心资产,而CDA数据分析师正是挖掘数据价值的 ...
2025-12-01数据分析师的日常,常始于一堆“毫无章法”的数据点:电商后台导出的零散订单记录、APP埋点收集的无序用户行为日志、传感器实时 ...
2025-11-28在MySQL数据库运维中,“query end”是查询执行生命周期的收尾阶段,理论上耗时极短——主要完成结果集封装、资源释放、事务状态 ...
2025-11-28在CDA(Certified Data Analyst)数据分析师的工具包中,透视分析方法是处理表结构数据的“瑞士军刀”——无需复杂代码,仅通过 ...
2025-11-28在统计分析中,数据的分布形态是决定“用什么方法分析、信什么结果”的底层逻辑——它如同数据的“性格”,直接影响着描述统计的 ...
2025-11-27在电商订单查询、用户信息导出等业务场景中,技术人员常面临一个选择:是一次性查询500条数据,还是分5次每次查询100条?这个问 ...
2025-11-27对数据分析从业者和学生而言,表结构数据是最基础也最核心的分析载体——CRM系统的用户表、门店的销售明细表、仓库的库存表,都 ...
2025-11-27在业务数据可视化中,热力图(Heat Map)是传递“数据密度与分布特征”的核心工具——它通过颜色深浅直观呈现数据值的高低,让“ ...
2025-11-26在企业数字化转型中,业务数据分析师是连接数据与决策的核心纽带。但“数据分析师”并非单一角色,从初级到高级,其职责边界、能 ...
2025-11-26