京公网安备 11010802034615号
经营许可证编号:京B2-20210330
没有成型的合作模式 大数据要深度参与政府治理,难!
“五一”前夕,百度、携程和遨游网依托各自的大数据,纷纷发布国内旅游热点预测。这些预测信息不仅成为一些游客安排出游行程的参考,也成为热门城市、热门景点加强旅游管理的重要依据。
“过去是百度一家,今年是三家,越来越多的企业进入到旅游预测领域。管中窥豹,可见一斑。目前我国越来越多的互联网企业已经开始同政府机构在各个领域开展合作,为政府管理提供大数据支持。”业内人士告诉科技日报记者,通常来讲,企业通过提供大数据支撑技术、大数据资源管理和大数据增值服务三种方式来获得价值。但是,目前我国大数据参与政府治理仍停留在统计分析层面上,建模和可视化应用较为匮乏,没有成型的合作模式。“大数据要深度参与政府治理,难!”
“死”数据难以发挥它的价值
“从整个决策过程来看,大数据能够帮助人类实时、大批量处理动态监测、医疗诊断、法律文书处理等专业任务;大数据分析模型能够对决策的结果进行仿真和效果呈现,帮助决策部门对整体方案和细节进行有针对性的优化;大数据还能根据实际需求和公众体验提供相应的决策信息反馈机制、决策调控纠偏机制。”中国电子信息产业发展研究院软件与信息服务业研究所博士周大铭指出,大数据能够全程参与决策,是科学决策的依据。但是,数据的数量、质量、种类和数据的分析能力直接影响决策的水平。“我们现在面临的问题是,数据不准,数据不全,数据共享很有限。”
“社会上的各种部门、机构都沉淀着大量的数据。但是,这些数据都是‘死’数据,没有真正发挥出它的价值。”亿赞普科技(集团)公司IPM高级总监陈春莹说。
从2013年开始,亿赞普连续三年为两会提供大数据服务,并在两会期间针对民生关注的热点问题,如油价、房价、上学情况等开展了民意洞察。陈春莹认为,政府治理有两个层面,民意洞察和决策执行。在民意洞察层面,并不缺少大数据支撑。在政府决策执行层面,大数据遭遇“部门墙”。
他说:“目前,由于涉及信息安全等问题,一些部门的数据无法对外开放,也就无法采集分析。即便是开放的数据,各省市和各部门也相对独立,形成了‘数据孤岛’,无法互联互通。同时由于国内暂时没有针对大数据制定相关标准,整合数据也就无从谈起。”
“2012年2月,纽约颁布了《开放数据法案》,通过立法的形式对开放数据的原则、路径、形式、公开周期等均进行了统一规定。当前,纽约数据开放平台共有近4000个数据集,数据涉及面非常广。”周大铭坦言,我国缺少相关法律的保障,要打破政府部门间的数据壁垒非常困难。
从数据、建模,到迭代、优化,需要大量的数据做支撑。模型越复杂,运算的维度越多,需要的数据量就越大。缺少数据支撑的模型迭代速度非常慢,模型优化也就更加不易。
大数据模型不可能一招定乾坤
有人提出,在政府大数据应用中我国具有后发优势,可以充分借鉴先行国家的经验,推动政府大数据应用的快速推广。事实上,这个后发优势的含金量并不那么高。
2014年10月10日,国家发展改革委联合相关部门共同展开“信息化(大数据)提升政府治理能力”研究。课题组搜集了美国纽约大数据应用的各种案例,但是所获信息并没有预想的那么多。
“我们只能看到,他们应用了大数据,得到了什么结果。至于怎么分析的,怎么操作,用的什么模型,中间过程是什么,我们从案例中根本找不到这些信息。”课题组成员周大铭对记者说,“我们还是要靠大数据建自己的模型。”
中国电子信息产业发展研究院软件与信息服务业研究所博士陈光,同为课题组成员,他告诉记者,大数据参与政府治理的原理是一致的,但是具体的参与方式是领域驱动或问题驱动的。也就是说,针对这个领域、这个问题的分析方法及其建立的模型,并不一定适用于另一个领域,或者另一个问题。“大数据模型不可能一招定乾坤。”
影响大数据模型的不只是应用领域和应用问题,相关因素的环境变化也会对模型产生重大作用。“谷歌流感趋势”就是一个非常具有代表性的例子。
“谷歌流感趋势”是谷歌公司多年前推出的一款预测流感的产品,它通过汇总用户的相关搜索记录,预测出世界上不同国家和地区的流感传播情况。2009年,甲型H1N1流感暴发的几周前,“谷歌流感趋势”成功预测了流感在美国境内的传播,其分析结果甚至具体到特定的地区和州,非常及时,令美国的公共卫生官员倍感震惊。但在近两年,“谷歌流感趋势”却屡屡出错。
“人们的搜索习惯发生了变化。过去搜流感信息是为了治病,现在搜流感信息的人并不一定是患者。这就导致‘谷歌流感趋势’模型出现了偏差。”周大铭强调,大数据在商业领域的应用,比如精准营销、广告推送,准确度从60%提高到70%,这10个百分点就能给企业带来巨大的效益。但是,政府治理对大数据的要求就高得多,预测准确度1%的差别都会对决策产生重要的影响。
大数据将强烈冲击当前的决策体系
业内人士提醒记者注意,大数据的定位是辅助决策,最终的决策还是由人来做。即便是这样,基于大数据的决策体系也会对当前的决策体系产生强烈冲击。
在陈春莹看来,这种冲击主要表现在两个方面:其一,政府的角色发生了重大变化,由管理者变为了服务者。其二,政府治理的方式,从碎片化走向系统化。
他以亿赞普的跨境贸易为例,进一步解释说,把中国优质产品卖到海外,要比国内的商品贸易复杂得多。它涉及很多问题,包括怎么评价企业,怎么搭建平台,怎么跨境支付,怎么解决商品的运输问题,商品到了国外怎么落地,等等。“我们把所有相关功能和流程全部理清,然后一个一个解决卡脖子的问题。为了解决跨境支付问题,亿赞普收购了钱宝。中国货品运到欧洲、中东、北非,没有直飞航班,亿赞普收购了意大利帕尔马国际机场。我们是基于大数据服务客户,用大数据来管理业务,是一种倒逼式创新。”陈春莹说。
大数据参与政府治理的整个决策体系,当然比企业的商业活动组织更为复杂,但这并不意味着此事不可做。业界人士反复强调,决定大数据能否深度参与政府治理的核心,是管理者的意识,而不是其他。
陈春莹介绍说,我国某些城市已经在探索建立市民卡管理系统,它融合了社保、身份证、医保、金融、公交卡等功能。亿赞普参与了这些城市市民卡项目的顶层设计。“市民卡比较适合在执行力特别强的城市来推行,未来也希望这种城市管理方式能够推广到全国。”
“企业利用大数据的方式是非常多样化的,相关管理者要多吸取他们的经验,在一些重点应用领域先行先试,比如政务、教育、医疗、旅游、交通等领域。”陈光指出,基于大数据的政府治理挑战传统的管理思维,涉及部门利益关系,非壮士断腕不可为。
案例解析
纽约怎么利用大数据强化城市管理
纽约是美国第一大城市,有来自近百个国家和地区的移民,给政府管理带来很大的困难。纽约市政府利用大数据在民生服务、市政府管理、能力提升等方面进行了积极地探索。
消除火灾隐患并治理群租房:为加强对群租房的治理,消除火灾隐患,纽约的数据分析团队汇总整理了该市19个机构的数据和90万栋建筑的信息。该团队将这些数据与近5年的火灾数据对比,得出一个预测模型,以估计不同建筑中的群租情况和火灾隐患的严重程度。筛选出的危险建筑中,有70%存在严重的火灾隐患,对群租房的检查效率提高了4倍。
地沟油检查:为确保地沟油的排放运送符合纽约企业诚信委员会的要求,纽约数据分析团队通过调取纽约企业诚信委员会登记的企业许可证数据,将未获得地沟油运送资格的餐厅统计出来,然后与其排污管道堵塞的地理数据图进行对比,能够迅速定位非法排放地沟油的餐厅,成功率高达95%。
治理冒名非法经营:针对非法经营者被吊销营业执照后冒用他人名义继续经营的问题,纽约市政府利用历史监测数据对店主变更前后的营业情况进行对比,包括收入、税收、被投诉次数等。如发现店主变更后营业数据无显著变化,则很可能存在冒名非法经营问题,基于这种预测开展的针对性检查,成功率提高了4倍。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在 MySQL 实际应用中,“频繁写入同一表” 是常见场景 —— 如实时日志存储(用户操作日志、系统运行日志)、高频交易记录(支付 ...
2025-10-30为帮助教育工作者、研究者科学分析 “班级规模” 与 “平均成绩” 的关联关系,我将从相关系数的核心定义与类型切入,详解 “数 ...
2025-10-30对 CDA(Certified Data Analyst)数据分析师而言,“相关系数” 不是简单的数字计算,而是 “从业务问题出发,量化变量间关联强 ...
2025-10-30在构建前向神经网络(Feedforward Neural Network,简称 FNN)时,“隐藏层数目设多少?每个隐藏层该放多少个神经元?” 是每个 ...
2025-10-29这个问题切中了 Excel 用户的常见困惑 —— 将 “数据可视化工具” 与 “数据挖掘算法” 的功能边界混淆。核心结论是:Excel 透 ...
2025-10-29在 CDA(Certified Data Analyst)数据分析师的工作中,“多组数据差异验证” 是高频需求 —— 例如 “3 家门店的销售额是否有显 ...
2025-10-29在数据分析中,“正态分布” 是许多统计方法(如 t 检验、方差分析、线性回归)的核心假设 —— 数据符合正态分布时,统计检验的 ...
2025-10-28箱线图(Box Plot)作为展示数据分布的核心统计图表,能直观呈现数据的中位数、四分位数、离散程度与异常值,是质量控制、实验分 ...
2025-10-28在 CDA(Certified Data Analyst)数据分析师的工作中,“分类变量关联分析” 是高频需求 —— 例如 “用户性别是否影响支付方式 ...
2025-10-28在数据可视化领域,单一图表往往难以承载多维度信息 —— 力导向图擅长展现节点间的关联结构与空间分布,却无法直观呈现 “流量 ...
2025-10-27这个问题问到了 Tableau 中两个核心行级函数的经典组合,理解它能帮你快速实现 “相对位置占比” 的分析需求。“index ()/size ( ...
2025-10-27对 CDA(Certified Data Analyst)数据分析师而言,“假设检验” 绝非 “套用统计公式的机械操作”,而是 “将模糊的业务猜想转 ...
2025-10-27在数字化运营中,“凭感觉做决策” 早已成为过去式 —— 运营指标作为业务增长的 “晴雨表” 与 “导航仪”,直接决定了运营动作 ...
2025-10-24在卷积神经网络(CNN)的训练中,“卷积层(Conv)后是否添加归一化(如 BN、LN)和激活函数(如 ReLU、GELU)” 是每个开发者都 ...
2025-10-24在数据决策链条中,“统计分析” 是挖掘数据规律的核心,“可视化” 是呈现规律的桥梁 ——CDA(Certified Data Analyst)数据分 ...
2025-10-24在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23在数据分析全流程中,“数据清洗” 恰似烹饪前的食材处理:若食材(数据)腐烂变质、混杂异物(脏数据),即便拥有精湛的烹饪技 ...
2025-10-23在人工智能领域,“大模型” 已成为近年来的热点标签:从参数超 1750 亿的 GPT-3,到万亿级参数的 PaLM,再到多模态大模型 GPT-4 ...
2025-10-22在 MySQL 数据库的日常运维与开发中,“更新数据是否会影响读数据” 是一个高频疑问。这个问题的答案并非简单的 “是” 或 “否 ...
2025-10-22