登录
首页精彩阅读大数据在应急管理中的应用2_数据分析师培训
大数据在应急管理中的应用2_数据分析师培训
2015-03-23
收藏

大数据在应急管理中的应用2_数据分析师培训


在微观层面,应对部门需要在应急处置和业务连续性之间保持平衡。大数据基础上的决策支持系统将成为强大的信息管理系统,能够做到实时报告,而且操作简易,能够同时集合多项关键指标的高效指挥决策辅助系统(见图3)。在大数据决策支持系统支撑下,交通、医护、警务、市政基础设施管理部门,需要及时沟通,为突发事件的处置提供有力的犯罪打击、充足的物力资源、及时的导航信息和必要的建筑图纸等。不同部门提供的信息,都需要纳入到大数据支撑的决策支持系统。如警务系统在接到报警后,将信息发送到决策支持系统,系统进行分析,确定事件的类型和位置,信息会在电子地图上显示,根据实践情况同时列出关键设备需求表,随后进行危机通报与应急响应。同时,交通部门将路况信息、可用资源和监控数据传输到决策支持系统,系统进行可视化操作,确定出通行路段和避免经过的路段,确定路线。医护部门根据决策支持系统的信息实时跟踪状态,可以有效调配可用资源,提高响应速度,与地理信息系统和地图系统相连以后,救护效率也会提高。

2.第三方组织或个人发布自发式地理信息

自发式地理信息是随着网络地图普及而出现的。普通民众可以在几乎没有相关专业知识的情况下,依靠自动或半自动的处理设备,使用地理信息系统绘制地图。特别在20世纪90年代以后,随着网络和GPS设备的普及,普通人进行定位和地图关联变得更加容易。这种方法在“大数据”概念出现之前就已有所应用。在谷歌的“我图”(My Maps)服务出现后,普通人也可以完成往常只有绘图师才能完成的任务。民众可以通过官方公布的坐标、自身获取的定位数据、或者网上未经证实的地理位置进行整理、关联、绘图,然后发布到网上。这一过程所使用的大多为开源数据,数据类型多样且大多非结构化。这种方法在应对南加州的森林大火时屡有应用,主要用来绘制火情地图以指导人们逃生和避险。

森林大火一直是南加州地区的梦魇,2007年7月到2009年5月期间发生的四场大火尤为惨烈。扎卡大火(Zaca Fire)始于2007年7月,持续两个月,这时居民主要依靠报纸、广播和电视新闻组成的政府信息系统了解火情,信息传递慢且获取被动。2008年7月,临近城市地带发生了盖普大火(Gap Fire),由无数帖子和网络相簿组成的自发式的理信息已经能为政府信息提供有益补充。到了2008年11月,圣巴巴拉附近的山上发生了“茶叶”大火(Tea Fire),网上迅速出现了各类自发式地理信息——文字报告、图片和视频。尽管谷歌没有立刻将这些信息整理发布,但是已经有一些当地报纸和社团组织办的网站来整理这些资料。同时一些志愿者发现,如果将搜集和编译后的分散信息整合进谷歌地图之类的电子地图,就可以制作出比政府信息还要方便快捷的灾害地图。[13]2009年5月,城市附近爆发杰苏斯塔大火(Jesusita Fire),许多组织和个人迅速建立了自发式地图站点,及时整合不断出现的自发式的地理信息和官方信息。政府公布的火灾边界图就是根据不断更新的市民报告做出的。在火灾后期,共有27个自发式在线网站,其中最广为人知的一个网站点击量超过60万。这个网站提供了许多灾害期间的必要信息,如火灾位置、疏散命令、紧急避难所位置等。[14]市民可以在政府通知之前自行选择撤离或采取防护措施。

由于政府信息缺乏良好的沟通渠道和证实信息的充分资源,所以其从产生到传递总是比自发式地理信息慢。尽管来自民间的信息也有可能产生错误,从而导致一些没有必要的撤离。但通过以上案例可以明显看出,自发式预报由误报而导致的不必要的撤离成本远比政府漏报的成本低,其应对灾害的重要意义也显而易见。[15]

在整个事中响应阶段,大数据的应用包括实时高效的数据信息收集、信息数据的迅速传递、多源数据集成处理、数据结果的可视化合成和最终实现机器或半机器化的辅助决策(详见图1)。数据收集方面根据应急管理主导者的不同有两种发展趋势:政府主导的专业应急管理团队信息收集逐渐专业化和高效化;以社会大众和社会媒体为依托的第三方应急管理力量则将信息收集方式发展为简单化和大众化的方式。信息传递方面大数据实时高效的特点要求信息传递方式不断创新,速度不断加快。数据的集成处理方面,根据大数据本身的特点,数据集成处理也具有巨量化、多样化和快速化的特点。可视化合成方面,应急管理所需的可视化结果必须简明直接和通俗易懂,第三方组织所使用的可视化方法还需要具有操作简便等特点。只有这样,大数据才能为事中响应提供快速而科学的机器决策或半机器决策。

(三)事后恢复与重建

大数据在应急管理事后的应用主要是在救援与恢复重建。目前在应急管理应用上比较新颖的是使用“分众(Crowd Sourcing)”的方式。“分众”是由大众通过网络分散完成工作任务,并通过整合后在网络上提供服务的一种方式。这个过程中使用的信息来源分散,体量巨大,并采取机器决策或半机器决策的方式利用信息。使用“分众”方法进行事后恢复与救援可以分为四个阶段:捕获信息,甄别加工信息、机器分析和迅速反应。捕获信息的方式可以是通过GPS定位发送自己的位置,也可以是通过社交网络发送某条文字信息。搜集到的信息会被汇集到分众平台上,这个过程可能需要机器与人协调完成。一些难以处理的信息会分配给志愿者进行加工,使之转变为计算机能识别的数据。如法语区内一条“推特”(Twitter)的信息可能并不适用于第三方软件处理,这时就需要志愿者先将这条信息翻译成英语,再将其中的关键信息提取分类,变得可为计算机处理。计算机会自动剔除无用和冗杂的信息,根据语义分析捕获含有有效信息的词条。随后,经过格式化的信息可以被计算机可视化或者作为统计资料加以利用,经过整合的信息可以发布在网上供众人浏览和使用。应急处置人员可以根据计算机的建议设计救援路线,配置救援装备,以最快速度抵达救援地点。

如2010年海地地震救援中,以“目击者”为代表的非营利网站利用“分众”方法起到了重要作用。总结分众式操作方法在应急管理中应用的流程图(见图4),可以看出,在灾害救援的过程中,需要有三个明确分工的角色完成整个操作:亲历地震的当地监测员、关联开放数据的网络操作员和救援组织中的信息官。


当地监测员通常是正在灾区的当事人。只要灾区当事人有一部能上网的手机,他就可以成为灾害应对活动中的一部分。当事人可以用多种方式发送求救信息,如推特(Twitter)或者脸书(Facebook)。推特可以通过话题标签将信息分类标注,经过分类标注的开源信息更容易被第三方识别和捕获。[16]

网络操作员通过捕获信息的第三方平台浏览到信息,并对信息进行处理。当求救信息是软件不支持的语言时,需要有另外的操作员(志愿者)完成翻译工作。随后,一条求救信息就可以被解析成几个不同的要素,从而由计算机进行识别和可视化。比如,“目击者”网站使用十个要素来描述一条信息,这些要素包括信息、标题、日期、位置(地点名称或者坐标)和需求等。这些要素是“海地目击者”团队设定的,每条信息中蕴含的需求都可以归入不同的类别中。然后,“目击者”报告平台利用CSV文档和简单信息聚合订阅(RSS Feed)的方式使得报告简易可读。最后,“目击者”还用一个交互式地图来公布实时报告。[17]

信息官指的是救援组织中负责搜集和处理信息的管理人员。信息官可以在网站上获取求救信息,从而迅速做出反应。信息官此刻至少可以确定目前急需的人道主义援助内容和地点。虽然开源信息的可信性并不能完全保证,但是,分众信息及其可视化在灾后最初的2-3天内,应用价值非常高。它可以用来指导灾情确认、救援实施以及其他可能需要协调的工作。[18]

尽管采用分众的方式对信息的捕获已经是非常便捷,但由于突发事件的紧急性,信息的实时接收与处理还是存在一定难度,分众平台上信息的真实性和准确性还需要确认,对信息官而言,如果能提前有时间学习平台的使用方法并了解其话语体系,灾后救援的效率将被大幅提高。目前,已有研究者通过相互关联的开源数据和分众处理的操作方法解决学习障碍、信息描述不清和真实性待定这三个问题。由于应急管理领域本身专业词汇缺乏且定义不清,在线共制平台的服务尚不完善,有时候也存在难以把信息官的数据端接入互联开源数据等问题。[19] 虽然该方法存在不足,按照目前的应用情况看,这种分众的方式潜力非常巨大。

三、对中国的启示

大数据的应用为我们提供了认识和解决问题的新思路,对中国有如下启示。

(一)制定国家大数据战略,加大对大数据投入

进入21世纪以来,特别是近年来,许多国家重视大数据在公共管理(包括应急管理)中的应用,并制定了国家级大数据战略。除美国的“大数据”战略外,澳大利亚在2013年8月明确提出了大数据国家战略并发布公共服务大数据政策[20];法国在2013年2月发布了《数字化路线图》,其中提到了支持大数据技术发展[21];日本在2013年6月正式公布了“创建最尖端IT国家宣言”,其中全面阐述了2013—2020年发展开放公共数据和大数据为核心的国家战略,旨在把日本建设成为一个具有“世界最高水准的广泛运用信息产业技术的社会”。[22]

许多国家还投入大量资金进行大数据研究,支持相关技术发展。英国在2013年1月宣布,将注资6亿英镑发展八类高新技术,其中投入1.89亿英镑用来发展大数据技术,以期在数据革命中占得先机。[23]法国则在2013年4月宣布,将投入1150万欧元用于支持7个未来投资项目,法国政府投资这些项目的目的在于“通过发展创新性解决方案,并将其用于实践,来促进法国在大数据领域的发展。”[24]

各国的大数据战略表明,“大数据”并不仅仅是一个技术概念,它已经切实成为提高国家治理能力,改进公共管理水平乃至增强国家竞争力的重要因素。目前,广东省已经在我国率先试水大数据战略,并宣布要在近期开放一部分政府数据。[25]这是我国地方政府回应“大数据时代”的具体措施。但是相对于英、美等西方国家和日、韩等亚洲近邻而言,我国还没有形成完善的国家级大数据战略。

(二)制定大数据开放政策,逐步扩大数据共享范围

除了制定大数据国家战略外,还要重视制定配套的数据开放政策,如目前美国政府数据开放网站(Data.Gov)可供检索的数据集已超过10万项。继美国之后,很多国家也制定政策要求数据开放。可以说,政府数据公开与共享是大数据化改革的核心内容。2010年1月,英国政府建立的数据开放网站(Data.Gov.uk),除去地理信息之外,该网站建成之初便公布了3000多项民生数据。2011年4月,英国劳工关系部、商业部又启动了“我的数据”(MyData)项目,要求即使是商业公司收集的数据,如果记录的是公民个人信息,个人便有权查看和使用。目前已有十多家不同行业的大公司参与到此项目中。[26]

新加坡是亚洲地区的数据开放先行者。该国在2011年6月启用了新加坡政府数据开放平台(Data.Gov.sg),开放了60多个机构的8600个数据集,50%的数据是机器可读的。其中的OneMap是一个地理空间数据共享平台,目前有60多种不同的地图主题。利用这些数据,一些企业和政府部门已经开发了100多项应用,涉及停车信息、公共厕所、野猫管理等。[27]在亚洲,日本、韩国等国家也有类似计划。

从各国的趋势看,配合国家大数据战略制定数据开放政策和要求数据共享也是非常必要的。另外,“数据开放”已经成为各国共识,随着国际数据市场的逐步形成,没有符合国际标准的国家级数据公开标准,也就难以建立能与国际市场接轨的数据市场管理标准。“数据开放”俨然已经成为国际竞争力的一环,且欧美等国已抢占先机。所以无论从优化公共管理(包括应急管理)的角度,还是从增强国家竞争力的角度,抑或是规范数据市场的角度,由中央政府领衔制定国家级数据开放政策是非常必要的。

(三)探索大数据在应急管理领域中具体的应用形式

事前准备阶段,政府或其他部门需要为大数据的应用做出准备。在管理和权限设置上,有必要设置“大数据信息官”并赋予其具有改进组织流程的权限,以推进大数据在部门工作中的落实。在技术升级和设备使用方面,政府或其他部门要明确需要解决的问题,以需求为导向,进行一定设施的准备。

事中响应阶段,信息的有效聚合和快速传递是核心环节。政府或其他部门在使用大数据增强信息采集能力的同时,也要进行数据共享,建立统一的数据中心,以便在应急管理过程中提高效率。同时,在应急管理的事中响应阶段,指挥人员、专家技术人员和现场处置人员的联系也至关重要,建立高效的信息共享渠道也是很重要的方面。

事后处置和救援阶段,及时了解救援信息和对所获信息的处理最为重要。如果有明确的信号可以让应急处置人员快速了解需要救援的地点和所需救援内容,救援效率便可大幅度提高。大数据在事后处置的应用便是遵循这种逻辑:通过网络或者监控设备,采集需要救援的信息,用算法筛选整合这些信息,并将指令快速传达给应急处置人员,从而提高救援效率。

(四)完善隐私保护政策,注重公共安全和公民隐私之间的平衡

大数据时代,如何对公民个人隐私保护也很重要,最好能在公共安全和公民隐私之间达到平衡。2013年5月,爱德华?斯诺登披露了美国国家安全局自2007年实施的绝密电子监听计划,即“棱镜计划”(PRISM),允许FBI和NSA对包括微软、雅虎、谷歌、苹果在内的共九家IT巨头的数据进行监控和挖掘,直接或间接接触大量个人聊天日志、私人数据、语音通信、传输文件和社交网络数据。[28]尽管美国自我标榜“重视个人隐私”,但是公民个人的数据信息没有得到有效保护,引发了对“大数据时代”个人隐私的广泛讨论和关注。

2014年5月,美国总统办公室发布“大数据隐私”报告称,越来越多的传感设备和智能设备,使得政府或企业对个人信息的搜集无处不在。这些数据不但被用来进行实时分析,还被储存起来,成为一个人的“电子脚印”。[29]技术对个人隐私的威胁已经超出了原有法律框架。如果不对采集的个人信息使用进行有效规范,极有可能会出现大规模侵犯隐私的事件,从而使大数据信息采集成为一种“社会安全隐患”。因此,全面的数据隐私保护与最大的公共安全追求将是大数据时代面对的一个重要课题。

四、结语

“大数据”在应急管理中的应用具有很大潜力和价值,本文只是在理解大数据内涵的基础上,根据应急管理的特点,总结了大数据应用的基本框架和分析了实践案例等,由于大数据在应急管理中的应用本身就是一个交叉学科研究的主题,还有很大的研究空间,希望本文能引起相关应急管理研究者和实务人员的思考,为进一步促进大数据在我国应急管理中的应用提供更有质量的研究成果和实践。

数据分析咨询请扫描二维码

最新资讯
更多
客服在线
立即咨询