
没有成型的合作模式 大数据要深度参与政府治理,难!
“五一”前夕,百度、携程和遨游网依托各自的大数据,纷纷发布国内旅游热点预测。这些预测信息不仅成为一些游客安排出游行程的参考,也成为热门城市、热门景点加强旅游管理的重要依据。
“过去是百度一家,今年是三家,越来越多的企业进入到旅游预测领域。管中窥豹,可见一斑。目前我国越来越多的互联网企业已经开始同政府机构在各个领域开展合作,为政府管理提供大数据支持。”业内人士告诉科技日报记者,通常来讲,企业通过提供大数据支撑技术、大数据资源管理和大数据增值服务三种方式来获得价值。但是,目前我国大数据参与政府治理仍停留在统计分析层面上,建模和可视化应用较为匮乏,没有成型的合作模式。“大数据要深度参与政府治理,难!”
“死”数据难以发挥它的价值
“从整个决策过程来看,大数据能够帮助人类实时、大批量处理动态监测、医疗诊断、法律文书处理等专业任务;大数据分析模型能够对决策的结果进行仿真和效果呈现,帮助决策部门对整体方案和细节进行有针对性的优化;大数据还能根据实际需求和公众体验提供相应的决策信息反馈机制、决策调控纠偏机制。”中国电子信息产业发展研究院软件与信息服务业研究所博士周大铭指出,大数据能够全程参与决策,是科学决策的依据。但是,数据的数量、质量、种类和数据的分析能力直接影响决策的水平。“我们现在面临的问题是,数据不准,数据不全,数据共享很有限。”
“社会上的各种部门、机构都沉淀着大量的数据。但是,这些数据都是‘死’数据,没有真正发挥出它的价值。”亿赞普科技(集团)公司IPM高级总监陈春莹说。
从2013年开始,亿赞普连续三年为两会提供大数据服务,并在两会期间针对民生关注的热点问题,如油价、房价、上学情况等开展了民意洞察。陈春莹认为,政府治理有两个层面,民意洞察和决策执行。在民意洞察层面,并不缺少大数据支撑。在政府决策执行层面,大数据遭遇“部门墙”。
他说:“目前,由于涉及信息安全等问题,一些部门的数据无法对外开放,也就无法采集分析。即便是开放的数据,各省市和各部门也相对独立,形成了‘数据孤岛’,无法互联互通。同时由于国内暂时没有针对大数据制定相关标准,整合数据也就无从谈起。”
“2012年2月,纽约颁布了《开放数据法案》,通过立法的形式对开放数据的原则、路径、形式、公开周期等均进行了统一规定。当前,纽约数据开放平台共有近4000个数据集,数据涉及面非常广。”周大铭坦言,我国缺少相关法律的保障,要打破政府部门间的数据壁垒非常困难。
从数据、建模,到迭代、优化,需要大量的数据做支撑。模型越复杂,运算的维度越多,需要的数据量就越大。缺少数据支撑的模型迭代速度非常慢,模型优化也就更加不易。
大数据模型不可能一招定乾坤
有人提出,在政府大数据应用中我国具有后发优势,可以充分借鉴先行国家的经验,推动政府大数据应用的快速推广。事实上,这个后发优势的含金量并不那么高。
2014年10月10日,国家发展改革委联合相关部门共同展开“信息化(大数据)提升政府治理能力”研究。课题组搜集了美国纽约大数据应用的各种案例,但是所获信息并没有预想的那么多。
“我们只能看到,他们应用了大数据,得到了什么结果。至于怎么分析的,怎么操作,用的什么模型,中间过程是什么,我们从案例中根本找不到这些信息。”课题组成员周大铭对记者说,“我们还是要靠大数据建自己的模型。”
中国电子信息产业发展研究院软件与信息服务业研究所博士陈光,同为课题组成员,他告诉记者,大数据参与政府治理的原理是一致的,但是具体的参与方式是领域驱动或问题驱动的。也就是说,针对这个领域、这个问题的分析方法及其建立的模型,并不一定适用于另一个领域,或者另一个问题。“大数据模型不可能一招定乾坤。”
影响大数据模型的不只是应用领域和应用问题,相关因素的环境变化也会对模型产生重大作用。“谷歌流感趋势”就是一个非常具有代表性的例子。
“谷歌流感趋势”是谷歌公司多年前推出的一款预测流感的产品,它通过汇总用户的相关搜索记录,预测出世界上不同国家和地区的流感传播情况。2009年,甲型H1N1流感暴发的几周前,“谷歌流感趋势”成功预测了流感在美国境内的传播,其分析结果甚至具体到特定的地区和州,非常及时,令美国的公共卫生官员倍感震惊。但在近两年,“谷歌流感趋势”却屡屡出错。
“人们的搜索习惯发生了变化。过去搜流感信息是为了治病,现在搜流感信息的人并不一定是患者。这就导致‘谷歌流感趋势’模型出现了偏差。”周大铭强调,大数据在商业领域的应用,比如精准营销、广告推送,准确度从60%提高到70%,这10个百分点就能给企业带来巨大的效益。但是,政府治理对大数据的要求就高得多,预测准确度1%的差别都会对决策产生重要的影响。
大数据将强烈冲击当前的决策体系
业内人士提醒记者注意,大数据的定位是辅助决策,最终的决策还是由人来做。即便是这样,基于大数据的决策体系也会对当前的决策体系产生强烈冲击。
在陈春莹看来,这种冲击主要表现在两个方面:其一,政府的角色发生了重大变化,由管理者变为了服务者。其二,政府治理的方式,从碎片化走向系统化。
他以亿赞普的跨境贸易为例,进一步解释说,把中国优质产品卖到海外,要比国内的商品贸易复杂得多。它涉及很多问题,包括怎么评价企业,怎么搭建平台,怎么跨境支付,怎么解决商品的运输问题,商品到了国外怎么落地,等等。“我们把所有相关功能和流程全部理清,然后一个一个解决卡脖子的问题。为了解决跨境支付问题,亿赞普收购了钱宝。中国货品运到欧洲、中东、北非,没有直飞航班,亿赞普收购了意大利帕尔马国际机场。我们是基于大数据服务客户,用大数据来管理业务,是一种倒逼式创新。”陈春莹说。
大数据参与政府治理的整个决策体系,当然比企业的商业活动组织更为复杂,但这并不意味着此事不可做。业界人士反复强调,决定大数据能否深度参与政府治理的核心,是管理者的意识,而不是其他。
陈春莹介绍说,我国某些城市已经在探索建立市民卡管理系统,它融合了社保、身份证、医保、金融、公交卡等功能。亿赞普参与了这些城市市民卡项目的顶层设计。“市民卡比较适合在执行力特别强的城市来推行,未来也希望这种城市管理方式能够推广到全国。”
“企业利用大数据的方式是非常多样化的,相关管理者要多吸取他们的经验,在一些重点应用领域先行先试,比如政务、教育、医疗、旅游、交通等领域。”陈光指出,基于大数据的政府治理挑战传统的管理思维,涉及部门利益关系,非壮士断腕不可为。
案例解析
纽约怎么利用大数据强化城市管理
纽约是美国第一大城市,有来自近百个国家和地区的移民,给政府管理带来很大的困难。纽约市政府利用大数据在民生服务、市政府管理、能力提升等方面进行了积极地探索。
消除火灾隐患并治理群租房:为加强对群租房的治理,消除火灾隐患,纽约的数据分析团队汇总整理了该市19个机构的数据和90万栋建筑的信息。该团队将这些数据与近5年的火灾数据对比,得出一个预测模型,以估计不同建筑中的群租情况和火灾隐患的严重程度。筛选出的危险建筑中,有70%存在严重的火灾隐患,对群租房的检查效率提高了4倍。
地沟油检查:为确保地沟油的排放运送符合纽约企业诚信委员会的要求,纽约数据分析团队通过调取纽约企业诚信委员会登记的企业许可证数据,将未获得地沟油运送资格的餐厅统计出来,然后与其排污管道堵塞的地理数据图进行对比,能够迅速定位非法排放地沟油的餐厅,成功率高达95%。
治理冒名非法经营:针对非法经营者被吊销营业执照后冒用他人名义继续经营的问题,纽约市政府利用历史监测数据对店主变更前后的营业情况进行对比,包括收入、税收、被投诉次数等。如发现店主变更后营业数据无显著变化,则很可能存在冒名非法经营问题,基于这种预测开展的针对性检查,成功率提高了4倍。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
Python HTTP 请求工具对比:urllib.request 与 requests 的核心差异与选择指南 在 Python 处理 HTTP 请求(如接口调用、数据爬取 ...
2025-09-12解决 pd.read_csv 读取长浮点数据的科学计数法问题 为帮助 Python 数据从业者解决pd.read_csv读取长浮点数据时的科学计数法问题 ...
2025-09-12CDA 数据分析师:业务数据分析步骤的落地者与价值优化者 业务数据分析是企业解决日常运营问题、提升执行效率的核心手段,其价值 ...
2025-09-12用 SQL 验证业务逻辑:从规则拆解到数据把关的实战指南 在业务系统落地过程中,“业务逻辑” 是连接 “需求设计” 与 “用户体验 ...
2025-09-11塔吉特百货孕妇营销案例:数据驱动下的精准零售革命与启示 在零售行业 “流量红利见顶” 的当下,精准营销成为企业突围的核心方 ...
2025-09-11CDA 数据分析师与战略 / 业务数据分析:概念辨析与协同价值 在数据驱动决策的体系中,“战略数据分析”“业务数据分析” 是企业 ...
2025-09-11Excel 数据聚类分析:从操作实践到业务价值挖掘 在数据分析场景中,聚类分析作为 “无监督分组” 的核心工具,能从杂乱数据中挖 ...
2025-09-10统计模型的核心目的:从数据解读到决策支撑的价值导向 统计模型作为数据分析的核心工具,并非简单的 “公式堆砌”,而是围绕特定 ...
2025-09-10CDA 数据分析师:商业数据分析实践的落地者与价值创造者 商业数据分析的价值,最终要在 “实践” 中体现 —— 脱离业务场景的分 ...
2025-09-10机器学习解决实际问题的核心关键:从业务到落地的全流程解析 在人工智能技术落地的浪潮中,机器学习作为核心工具,已广泛应用于 ...
2025-09-09SPSS 编码状态区域中 Unicode 的功能与价值解析 在 SPSS(Statistical Product and Service Solutions,统计产品与服务解决方案 ...
2025-09-09CDA 数据分析师:驾驭商业数据分析流程的核心力量 在商业决策从 “经验驱动” 向 “数据驱动” 转型的过程中,商业数据分析总体 ...
2025-09-09R 语言:数据科学与科研领域的核心工具及优势解析 一、引言 在数据驱动决策的时代,无论是科研人员验证实验假设(如前文中的 T ...
2025-09-08T 检验在假设检验中的应用与实践 一、引言 在科研数据分析、医学实验验证、经济指标对比等领域,常常需要判断 “样本间的差异是 ...
2025-09-08在商业竞争日益激烈的当下,“用数据说话” 已从企业的 “加分项” 变为 “生存必需”。然而,零散的数据分析无法持续为业务赋能 ...
2025-09-08随机森林算法的核心特点:原理、优势与应用解析 在机器学习领域,随机森林(Random Forest)作为集成学习(Ensemble Learning) ...
2025-09-05Excel 区域名定义:从基础到进阶的高效应用指南 在 Excel 数据处理中,频繁引用单元格区域(如A2:A100、B3:D20)不仅容易出错, ...
2025-09-05CDA 数据分析师:以六大分析方法构建数据驱动业务的核心能力 在数据驱动决策成为企业共识的当下,CDA(Certified Data Analyst) ...
2025-09-05SQL 日期截取:从基础方法到业务实战的全维度解析 在数据处理与业务分析中,日期数据是连接 “业务行为” 与 “时间维度” 的核 ...
2025-09-04在卷积神经网络(CNN)的发展历程中,解决 “梯度消失”“特征复用不足”“模型参数冗余” 一直是核心命题。2017 年提出的密集连 ...
2025-09-04