
大数据影响国家治理的三大问题
针对大数据时代国家治理的发展,中国人民大学信息资源管理学院教授安小米在《学术前沿》上发文,从“政府数据开放利用”“政务数据连续性管理”“大数据背景下国家机关个人信息保护”探索了大数据时代信息治理存在的三个方面问题,对其应对原则和实现途径进行了探讨。
政府大数据开放利用是社会治理公共服务能力提升的关键要素
我国政府部门掌握着大量的社会信息资源,这种局面是在长期计划经济体制下形成的,也与政府采集和政府管理审批机制有密切关系。
尽管自改革开放以来,市场机制在信息服务领域发挥了平衡价格与竞争的重要作用,但是在信息资源供给方面,尤其是在交通、工商、能源、环境等关键领域,政府部门仍然拥有对数据资源绝对的垄断。
与此相对,政府部门在充分开发利用这些数据资源方面的能力不足。首先是人力资源与人才队伍的紧缺。其次,政府部门缺乏开发这些数据资源的动力和激励。
政府数据开放利用是提高政府公信力的重要途径,是透明政府和公民社会建设的重要组成部分,是政府“用数据说话”,提高基于证据的国家治理能力的重要途径,有利于市民了解并施行他们的权利,增强其参与城市共治的积极性与话语权,促进社会稳定和谐发展。
政府数据开放利用是促进经济增长的强大推动力,有利于促进协同创新、竞争能力与生产能力提升及经济复苏,数据开放利用不仅可以提高政府资金支出的效率,还可以为大众提供更多更好的增值创新服务选择。
政府数据开放利用计划活动应该遵循以下原则:
第一,以合法合规合标开放利用为原则,以不提供开放利用为例外;
第二,安全原则,根据安全等级确定数据开放利用范围、风险等级及使用权限,注意国家机密、商业机密和个人隐私的保护;
第三,增值导向原则,开放的目的是促进数据资源社会化增值开放利用,注意数据资源的公益性和商业性利用及其经济与社会价值实现,促进政府整体效率、效益和效能提升,行政效用、经济效用和社会效用提高;
第四,连续性管理原则,政府数据资源是城市公共信息资产,国家机关应按照统一规划和持续改进的全程管理原则,开展其政府数据全生命期的管理,合法采集、合规登记、合标更新、安全存储和及时处置,保证管理活动的连贯性、一致性和规范性;
第五,可持续利用原则,数据具有真实性、可靠性、完整性和可用性,内容可取、可信并及时更新,资源可跟踪、可回溯和可关联,格式机读,方便下载并可持续再用;
第六,责权利统一原则,政府数据属公共资产,政府对数字采集质量和开放使用授权及数据资源服务平台负责,数据开发商和数据使用者对下载后数据的使用行为负责。
政务数据连续性管理是社会治理协同创新能力提升的关键要素
政府大数据也需要相互关联。大数据之大,除了传统的三个“V”( Volume,Variety和Velocity)之外,更重要的在于独立的数据一旦相互关联起来了之后,能从多个维度挖掘出更多的价值,其包含的信息内涵也是几何级数式的增长。
从整体上来看,我国政府大数据仍然是处于割裂的状态。而政府大数据的割裂其实是我国政府部门的条块管理体制的一个缩影。“信息孤岛”问题严重,各政府部门都为解决该问题开始了部门内部的各子系统、业务系统的整合工作,以及上下级部门的系统对接工作。
数字连续性的涵义包含为以下四个方面:
一是指数字生成记录,能够以数字方式保存和提供可持续再用的能力;
二是指数字生成信息,能够以数字方式维护,确保其可获取、可信任和可持续再用的能力;
三是指数字生成内容,应该能够以数字方式管理,确保其可跟踪、可溯源、可关联和可控制的能力;
四是指数字连续性的业务过程、管理过程中,有相应的政策制度连续供给作为保障,同时,有技术、人员、资金、信息环境、业务需求等作为数字连续性的有效支撑。
政务数据连续性管理的基本原则及实现途径包括以下三个方面:宏观层,提出主体联盟原则,制定政务数据连续性行动计划,实施数据资源资产管理,建立数据资产登记管理制度、验证制度和认证制度,目标互联、互通、互认,确保数字凭证和电子证照的合法性采集和合理性利用,以此提升我国国家数字信息资源的安全力、证据力、服务力和控制力;
中观层,提出活动联通原则,制定政府数据处理活动规范化管理标准,实施数据资源风险管理,建立跨地区、跨部门和跨层级的数据采集、共享交换、存储、处置、发布统一标准和数据开放利用授权许可框架及契约管理制度,避免因数据管理不善带来的信息丢失、记忆忘却、身份无法认同、个人隐私和国家机密泄露威胁等高风险,将政府信息资源治理纳入国家治理现代化能力提升的范畴;
微观层,提出要素联接原则,制定覆盖数字文件全生命期、数字信息全流程、数字资源全要素的数据资源全面质量管理协同创新平台,实施电子文件自动化管理和数据开放利用在线授权许可,将数据文件自动化管理、数字信息网络化管理和数字资源智能化管理技术联接,并嵌入政府和大数据工程信息基础架构,以此提升大数据时代的政府公共服务能力和社会管理创新能力。
个人信息保护是提升社会治理信息安全能力的关键因素
十年前,当互联网正处于萌芽阶段,网络身份是虚拟的、模糊的。我们无法确定网友的性别和年龄。十年后,信息技术的革命带来了大数据时代,我们的联系方式、喜爱偏好甚至同事、家人、朋友都被掌握得一清二楚。我们都成了“透明人”。同时可以看到,我国现有涉及个人信息保护的29部法律尚无专门针对网络环境的特殊要求。
针对我国尚无专门的政府信息资源管理办法和个人信息保护法律的现状,提出以下在法律法规不健全的背景下,如何构建适用于大数据项目应用的个人信息保护对策的基本原则。
一是合法便民原则。政府部门采集个人信息应该建立信息采集登记制度,政府部门内和部门间共享个人信息应该依法依职,从方便信息主体和降低公共服务成本的角度,从信息惠民工程建设需求出发,做好个人信息采集登记和共享使用过程记录,以备后查,跟踪审计和持续改进。
二是安全性维护原则。个人信息保护需要维护个人信息的保密性、完整性、真实性、可靠性、可用性,管理体系、管理制度、管理规范、管理技术配套,防止未经授权的复制、修改、使用和公开数据,防止个人信息泄露、丢失、损毁、篡改或其他安全事故的发生。
三是全程管理原则。个人信息不仅是大数据项目的重要数据来源,也是重要的社会资源和个人资产,需要统筹管理,建立基于个人信息全生命期和信息处理全流程、信息管理活动全要素的综合集成管理体系,对信息处理的关键节点实施风险控制,对信息采集、使用与共享、更新和处置、安全与保管、信息系统管理、监督检查与咎责等活动进行规范,保证管理活动的连贯性、一致性和规范性,提高社会管理和公共服务效能。
四是信息化治理原则。大数据项目应用背景下,应当建立基于信息全流程管理的信息化治理制度和规范,确保数字个人信息采用数字方式保存和提供再用,应该构建信息化项目个人信息保护的服务与产品认证体系和品牌标识。
五是风险导航原则。大数据项目应用背景下,个人信息的共享再用不可避免,但需要合法、合规、合标、合理,按照“共同带有区别”的原则,制定分类保护的目录和分级授权利用的规范,将个人信息分为个人一般信息和个人敏感信息,编制个人信息分类保护目录和制定分级利用授权规则,便于控制风险,易于信息化管理,以维护信息主体的合法权益不受侵害。
六是协同管理原则。考虑大数据项目应用背景下的个人信息保护复杂性、不确定性和集成性特点,应该将其嵌入政府信息资源管理规划,多关系联通;纳入政务绩效评估与问责,纳入信息化项目绩效评估,多主体联盟;嵌入政务资源管理标准体系,多政策规范联贯;嵌入信息化项目合同契约协议,嵌入在线服务要求,多要素联接。
七是综合集成管理原则。大数据项目应用背景下个人信息保护不仅是政府信息资源管理的重要内容,也是政府信息资源社会化开发利用的保障,个人信息保护应该嵌入服务型政府建设体系,嵌入国家机关公务人员管理技能及能力构建,增强国家机关个人信息保护意识与管理责任,提升政府的社会管理及服务能力;
组织层面,应该以信息资源全生命管理思想为指导,以个人风险评估及安全控制为手段,建立合法、合规、合标和合理的管理制度,嵌入国家机关电子政务绩效考核体系;
大数据应用项目层面,应该建立可规划、可实施、可评估和可持续改进的信息化项目个人信息保护与管理方案,纳入政府信息化投资项目的绩效评估体系,系统采购外包,信息安全技术工具认证等行动计划,使个人信息保护可管理和可控制,确保其安全利用,服务于民。
综上所述,政府数据开放利用、政务数据连续性管理和国家机关个人信息保护问题是政府社会治理的关键要素,直接影响大数据时代政府社会治理的公共服务能力、协同创新能力、信息安全能力及国家治理现代化能力提升。
从整体规划的角度提出部署政府数据开放利用计划、实施政务数据连续性管理制度和制定适用于大数据项目应用的个人信息保护对策的基本原则与实现途径,为大数据治理和信息治理环境改善可以提供了新的路径。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在手游行业,“次日留存率” 是衡量一款游戏生死的 “第一道关卡”—— 它不仅反映了玩家对游戏的初始接受度,更直接决定了后续 ...
2025-10-13分库分表,为何而生? 在信息技术发展的早期阶段,数据量相对较小,业务逻辑也较为简单,单库单表的数据库架构就能够满足大多数 ...
2025-10-13在企业数字化转型过程中,“数据孤岛” 是普遍面临的痛点:用户数据散落在 APP 日志、注册系统、客服记录中,订单数据分散在交易 ...
2025-10-13在数字化时代,用户的每一次行为 —— 从电商平台的 “浏览→加购→购买”,到视频 APP 的 “打开→搜索→观看→收藏”,再到银 ...
2025-10-11在机器学习建模流程中,“特征重要性分析” 是连接 “数据” 与 “业务” 的关键桥梁 —— 它不仅能帮我们筛选冗余特征、提升模 ...
2025-10-11在企业的数据体系中,未经分类的数据如同 “杂乱无章的仓库”—— 用户行为日志、订单记录、商品信息混杂存储,CDA(Certified D ...
2025-10-11在 SQL Server 数据库操作中,“数据类型转换” 是高频需求 —— 无论是将字符串格式的日期转为datetime用于筛选,还是将数值转 ...
2025-10-10在科研攻关、工业优化、产品开发中,正交试验(Orthogonal Experiment)因 “用少量试验覆盖多因素多水平组合” 的高效性,成为 ...
2025-10-10在企业数据量从 “GB 级” 迈向 “PB 级” 的过程中,“数据混乱” 的痛点逐渐从 “隐性问题” 变为 “显性瓶颈”:各部门数据口 ...
2025-10-10在深度学习中,“模型如何从错误中学习” 是最关键的问题 —— 而损失函数与反向传播正是回答这一问题的核心技术:损失函数负责 ...
2025-10-09本文将从 “检验本质” 切入,拆解两种方法的核心适用条件、场景边界与实战选择逻辑,结合医学、工业、教育领域的案例,让你明确 ...
2025-10-09在 CDA 数据分析师的日常工作中,常会遇到这样的困惑:某电商平台 11 月 GMV 同比增长 20%,但究竟是 “长期趋势自然增长”,还 ...
2025-10-09Pandas 选取特定值所在行:6 类核心方法与实战指南 在使用 pandas 处理结构化数据时,“选取特定值所在的行” 是最高频的操作之 ...
2025-09-30球面卷积神经网络(SCNN) 为解决这一痛点,球面卷积神经网络(Spherical Convolutional Neural Network, SCNN) 应运而生。它通 ...
2025-09-30在企业日常运营中,“未来会怎样” 是决策者最关心的问题 —— 电商平台想知道 “下月销量能否达标”,金融机构想预判 “下周股 ...
2025-09-30Excel 能做聚类分析吗?基础方法、进阶技巧与场景边界 在数据分析领域,聚类分析是 “无监督学习” 的核心技术 —— 无需预设分 ...
2025-09-29XGBoost 决策树:原理、优化与工业级实战指南 在机器学习领域,决策树因 “可解释性强、处理非线性关系能力突出” 成为基础模型 ...
2025-09-29在标签体系的落地链路中,“设计标签逻辑” 只是第一步,真正让标签从 “纸上定义” 变为 “业务可用资产” 的关键,在于标签加 ...
2025-09-29在使用 Excel 数据透视表进行多维度数据汇总时,折叠功能是梳理数据层级的核心工具 —— 通过点击 “+/-” 符号可展开明细数据或 ...
2025-09-28在使用 Pandas 处理 CSV、TSV 等文本文件时,“引号” 是最容易引发格式混乱的 “隐形杀手”—— 比如字段中包含逗号(如 “北京 ...
2025-09-28