京公网安备 11010802034615号
经营许可证编号:京B2-20210330
揭开政府大数据应用的面纱
“大数据将从一个时髦的概念走进我们生活中的方方面面。帮助我们更好地认识世界,认识自己,构建全新的社会关系。”清华大学数据科学研究院执行副院长韩亦舜说。
“《关于促进大数据发展的行动纲要》(以下简称《行动纲要》)标志着大数据在我国的发展与应用已经上升到国家战略层面。”赛迪顾问分析师卢敏说,“《行动纲要》明确指出推动政府大数据开放、共享和安全的重要性。而要使《行动纲要》中的内容尽快成为促进大数据发展和推进大数据应用的实际行动,还有很多问题要解决。”
数据潜在利用价值高
《行动纲要》涉及三个关键词:共享、开放、安全。卢敏指出,三个关键词背后指向三个问题:“共享”指向为什么要加快政府大数据公开的进程,“开放”指向企业创新的动力源在哪里,“安全”指向如何保护个人隐私和信息安全。
“政府大数据公开的目的是改善民生,企业创新的目的是促进结构转型,信息安全建设的目的是完善法律。三个关键词分别指向社会、经济、法律等不同领域。由此看来,大数据产业牵一发而动全身。”卢敏说。
共享、开放、安全的出发点和落脚点都指向政府大数据的开放共享、研究与应用、示范影响效应等。我们不禁要问,政府大数据的价值究竟何在?
就数量而言,BAT(百度、阿里、腾讯)拥有数以亿计的用户量,但这与政府大数据规模相比,可谓小巫见大巫。卢敏介绍说:“粗略估算,全国政府大数据加起来至少也有数百甚至上千个阿里巴巴的体量。”
至于政府大数据的质量,则可以通过和BAT企业对比来说明。据介绍,百度拥有庞大的用户搜索记录,每个网民都会留下众多记录,但这些数据较为单一,不进行关联应用就无法显示价值;腾讯的优势在于拥有数以亿计的QQ和微信用户量以及更庞大的社交数据,但这些数据目前仅局限于营销应用;阿里的交易数据似乎价值更高,但也只是局限在电商领域以及外延应用。“BAT的共同短板在于数据种类的单一化程度较高。”卢敏说。
政府大数据涉及工商、税务、司法、交通、医疗、教育、通信等等领域,数据的种类繁多,关联性强、统计规格较为统一,便于应用处理。九次方大数据创始人王叁寿曾表示“政府的数据事关百姓生活的方方面面,数据的利用价值也最高”。
开放标准待建立
真正的大数据除了量大,另一个特点是变化多,如图片、视频、大段文字这些不能用数字化处理的数据,属于非结构化数据。只有非结构化的数据才更具有开发价值。
政府的很多数据,例如人口、户籍等,属于结构化数据,离非结构化的大数据概念还有一定距离。但就目前阶段来看,政府推动大数据产业发展仍有现实意义。
通过与大数据紧密相连的互联网,在市民服务设施众包、提高政府监督职能等方面,百姓能够参与进来。“政府信息的开放共享,有助于提高政府的公信力。”韩亦舜说。
政府数据的开放,不但能帮助政府提高自身透明度并提升治理能力和效率,也是促进经济发展和社会创新的重要推力。然而,在政府数据资源共享开放工程当中,数据的开放程度与开放内容的标准,目前似乎并没有定论。
复旦大学国际关系与公共事务学院副教授郑磊在《中国开放政府数据平台研究:框架、现状与建议》一文中提出,经过样本的数据采集分析,截至2015年5月,各地开放政府数据实践共计公开了1963个数据集。其中公开数据最多的是武汉(635个),最少的则是贵州(17个)。
努力打造大数据产业新高地的贵州,在政府数据开放方面面临着新的挑战。
郑磊指出,中国开放政府数据实践存在的问题主要有目前开放的数据量少、价值低、可机读比例低,开放的多为静态数据,数据授权协议条款含糊,缺乏便捷的数据获取渠道,缺乏高质量的数据应用,缺乏便捷、及时、有效、公开的互动交流等。
“《行动纲要》为信息开放共享指明了出路,但是政府大数据如何应用,还要看接下来的行动和规则制定。”卢敏说。
针对问题,郑磊建议加强管理架构建设,制定相关政策与工作机会,提高领导支持能力,基于社会需求开放高价值数据、展现数据应用,提升数据开放性与可机读比例,规范数据更新周期,落实数据更新工作,完善数据授权协议,降低数据获取与互动门槛,推动有效公开的沟通。
数据利用如何破冰
目前,一些发达国家政府在数据开放方面走在了前面,甚至把数据开放当做执政自信的标志,公开一些政府日常消费方面的支出供市民监督。
我国政府数据利用方面特别是数据共享方面确实存在一些误区。一方面说到开放就好像完全没有隐私,另一方面安全问题又成为了数据开放的最大障碍。
韩亦舜认为,政府数据开放要在实践中摸索前进。先把政府部门内部及部门之间数据共享的工作做起来。对社会的数据开放共享,先从方便百姓生活又不是很敏感的数据开始。特别是涉及公共安全、公共利益的数据,提供公共服务的机构或企业有义务在一定前提条件下开放,“这样一些可以预警、预防的群体性事件就能够避免”。
韩亦舜指出,按照流行的大数据的几个“V”(大量、高速、多样、价值)或者多源异构的定义来衡量,政府的部分数据,还属于结构化数据,离大数据概念还有差异。但没有必要拘泥于大数据的定义,只要政府充分运用数据的挖掘利用,提高政府治理能力,提高科学决策能力,受益的将是全社会。
在政府开放数据方面,韩亦舜建议,各级政府都以数据应用为导向,需要什么数据就共享什么数据。虽然,与大数据的开发共享还有距离,但确实是数据应用的可行路径。
韩亦舜说,相信越多的人从数据开放中获益,就会有更多的人愿意开放数据。
背景资料
《关于促进大数据发展的行动纲要》
主要内容及对产业的部署
《行动纲要》的内容可以概括为“三位一体”,即围绕全面推动我国大数据发展和应用,加快建设数据强国这一总体目标,确定三大重点任务:一是加快政府数据开放共享,推动资源整合,提升治理能力;二是推动产业创新发展,培育新业态,助力经济转型;三是健全大数据安全保障体系,强化安全支撑,提高管理水平,促进健康发展。围绕这“三位一体”,具体明确了五大目标、七项措施、十大工程。并且据此细化分解出76项具体任务,确定了每项任务的具体责任部门和进度安排,确保《行动纲要》的落地和实施。
五个目标:一是打造精准治理、多方协作的社会治理新模式;二是建立运行平稳、安全高效的经济运行新机制;三是构建以人为本、惠及全民的民生服务新体系;四是开启大众创业、万众创新的创新驱动新格局;五是培育高端智能、新兴繁荣的产业发展新生态。
七项措施:完善组织实施机制、加快法规制度建设、健全市场发展机制、建立标准规范体系、加大财政金融支持、加快专业人才培养、促进国际交流合作。
十项工程:政府数据资源共享开放工程、国家大数据资源统筹发展工程、政府治理大数据工程、公共服务大数据工程、工业和新兴产业大数据工程、现代农业大数据工程、万众创新大数据工程、大数据关键技术及产品研发与产业化工程、大数据产业支撑能力提升工程、网络和大数据安全保障工程。
按照国务院的部署,工业和信息化部主要负责推动大数据产业发展,培育新兴业态,助力经济转型,包括推进大数据核心技术攻关、健全产品体系、完善产业链和发展环境、推进工业及新兴产业大数据应用,同时做好信息安全和规范管理等的相关工作。重点组织实施十大工程中的“大数据关键技术及产品研发与产业化工程”“大数据产业支撑能力提升工程”“工业和新兴产业大数据工程”三项工程。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
CDA中国官网是全国统一的数据分析师认证报名网站,由认证考试委员会与持证人会员、企业会员以及行业知名第三方机构共同合作,致 ...
2025-12-26在数字化转型浪潮下,审计行业正经历从“传统手工审计”向“大数据智能审计”的深刻变革。教育部发布的《大数据与审计专业教学标 ...
2025-12-26统计学作为数学的重要分支,是连接数据与决策的桥梁。随着数据规模的爆炸式增长和复杂问题的涌现,传统统计方法已难以应对高维、 ...
2025-12-26数字化浪潮席卷全球,数据已成为企业核心生产要素,“用数据说话、用数据决策”成为企业生存与发展的核心逻辑。在这一背景下,CD ...
2025-12-26箱线图(Box Plot)作为数据分布可视化的核心工具,凭借简洁的结构直观呈现数据的中位数、四分位数、异常值等关键信息,广泛应用 ...
2025-12-25在数据驱动决策的时代,基于历史数据进行精准预测已成为企业核心需求——无论是预测未来销售额、客户流失概率,还是产品需求趋势 ...
2025-12-25在数据驱动业务的实践中,CDA(Certified Data Analyst)数据分析师的核心工作,本质上是通过“指标”这一数据语言,解读业务现 ...
2025-12-25在金融行业的数字化转型进程中,SQL作为数据处理与分析的核心工具,贯穿于零售银行、证券交易、保险理赔、支付结算等全业务链条 ...
2025-12-24在数据分析领域,假设检验是验证“数据差异是否显著”的核心工具,而独立样本t检验与卡方检验则是其中最常用的两种方法。很多初 ...
2025-12-24在企业数字化转型的深水区,数据已成为核心生产要素,而“让数据可用、好用”则是挖掘数据价值的前提。对CDA(Certified Data An ...
2025-12-24数据分析师认证考试全面升级后,除了考试场次和报名时间,小伙伴们最关心的就是报名费了,报 ...
2025-12-23在Power BI数据可视化分析中,矩阵是多维度数据汇总的核心工具,而“动态计算平均值”则是矩阵分析的高频需求——无论是按类别计 ...
2025-12-23在SQL数据分析场景中,“日期转期间”是高频核心需求——无论是按日、周、月、季度还是年度统计数据,都需要将原始的日期/时间字 ...
2025-12-23在数据驱动决策的浪潮中,CDA(Certified Data Analyst)数据分析师的核心价值,早已超越“整理数据、输出报表”的基础层面,转 ...
2025-12-23在使用Excel数据透视表进行数据分析时,我们常需要在透视表旁添加备注列,用于标注数据背景、异常说明、业务解读等关键信息。但 ...
2025-12-22在MySQL数据库的性能优化体系中,索引是提升查询效率的“核心武器”——一个合理的索引能将百万级数据的查询耗时从秒级压缩至毫 ...
2025-12-22在数据量爆炸式增长的数字化时代,企业数据呈现“来源杂、格式多、价值不均”的特点,不少CDA(Certified Data Analyst)数据分 ...
2025-12-22在企业数据化运营体系中,同比、环比分析是洞察业务趋势、评估运营效果的核心手段。同比(与上年同期对比)可消除季节性波动影响 ...
2025-12-19在数字化时代,用户已成为企业竞争的核心资产,而“理解用户”则是激活这一资产的关键。用户行为分析系统(User Behavior Analys ...
2025-12-19在数字化转型的深水区,企业对数据价值的挖掘不再局限于零散的分析项目,而是转向“体系化运营”——数据治理体系作为保障数据全 ...
2025-12-19