
基于物联网技术的警务大数据分析模型构想
背景介绍
警察作为一个国家的重要机构,肩负着维护社会稳定,打击违法犯罪的重要职责,面对着越来越狡猾的犯罪分子,警方需要有效提升预防和打击犯罪的能力,单靠警员人工破案已无法满足社会需求,因此国家提出“科技强警”的发展战略,借助高科技装备、信息化手段帮助警方打击违法犯罪,“金盾工程”更是将公安信息化建设推向了高潮。然而,随着信息时代的到来,犯罪分子作案手段越发多变、隐蔽,传统的信息化手段已很难帮助警方快速分析研判。
近年来,“物联网”、“大数据”越来越被人们所熟知,著名的“谷歌汽车”、“大数据流感预测”更是成为物联网技术与大数据预测应用的经典案例。这两个在几年前还不为人知的技术名词,仿佛是在一夜之间闯入了我们的生活,将人们拉入了科幻电影中的场景。那什么是“物联网”、“大数据”呢?
物联网技术是利用互联网等通信技术手段把传感器、控制器、机器、人与物通过新的方式联系在一起,形成人与物、物与物互联,实现信息化,远程管理控制和智能化的网络。
作为物联网之后IT行业又一大颠覆性的技术革命,大数据是信息爆炸时代的产物,人们每天上网、交流、购物、订票……产生了数以亿级的数据,而这项技术的意义并不在于掌握了庞大的数据信息,而在于对这些含有意义的数据进行专业化的预测处理。
警方分析研判的关键是挖掘人员、组织、案(事)件、阵地以及物品五要素之间的关联关系,如果能够借助物联网技术获取五要素信息,那么将大大提升警方获取线索信息的效率,同时也能避免人为错误。而面对庞杂的线索信息,则可以借助大数据分析技术实现深入,高效的挖掘分析,进而快速找出五要素之间的关联关系。
本文试图探讨构建一套基于物联网技术的警务大数据分析模型,借以提高警方线索采集和分析研判过程的准确性和效率。
技术架构
基于物联网技术的警务大数据分析模型是一种利用大数据分析算法对海量警务物联网线索信息进行深度挖掘分析的系统模型。它包括了物联感知层、数据传输层、数据分析层以及数据展示层,同时,它还要与现有的公安信息网有效融合,实现信息共享碰撞。
■ 物联感知层
警务物联网,是指利用感知技术与智能装置对警务工作关注对象进行自动感知识别,通过网络,技术处理和智能分析,实现对关注对象状态和态势信息的实时掌握,达到对关注对象动态监测、精确管理和科学指挥的目的。目前警方所应用的场景有旅客身份证查验、警车警员GPS定位、城区视频监控、道路卡口车辆监控、重点部位报警防范、重点人员手机定位、枪支RFID标签定位等,可以采集到人员、车辆以及物品的城市时空数据,为警方建立基本要素排查提供大量真实可靠的原始数据。
■ 数据传输层
经过移动互联网、有线网络等媒介传输到系统模型的物联网数据,具有数据量大,且分布在不同时域,空域的特点,是无法直接使用的,为此需要按照一定的标准规则对它们进行初步的筛选和归类整合,将其转化为兼容系统模型的,具有统一规范标准的“元数据”。
■ 数据分析层
经过初步归类整合的数据依旧是海量且缺乏直观联系关系,无法为警方提供研判依据,为此需要借助专业的数据挖掘算法对这些数据进一步分析、整合。同时还要与公安信息网中的线索与情报进行碰撞,以降低单一数据源造成的信息可靠性低等问题。常用的分析算法有分类分析、回归分析、聚类分析以及关联分析。
Ø 分类分析
根据一定的分类准则将具有不同特征的数据划分到不同类别的过程。以某地区团伙作案为例,该区域近一段时期是团伙犯罪高发期,警方对该区域以及邻近区域娱乐场所以及出租屋的人员进行集中排查,采集到大量的身份证信息和手机串号信息。
通过对午夜时段的身份证号以及手机串号进行碰撞,可以筛选出一批经常出入于犯罪高发区的可疑人员名单,进而帮助警方缩小排查范围。
Ø 回归分析
通过对自变量和因变量做一定的相关性分析,由此建立回归方程,用以预测变量的依赖关系。加利福尼亚警方曾利用火灾预警系统来预测建筑物火情以及分析纵火案。
加利福尼亚警方通过将一年内火灾案件与当天天气,建筑物自身因素等资料数据化,形成了一套火灾级别与火灾因素的拟合函数,当火灾因素点越丰富时,拟合出来的火灾隐情拟合函数曲线就越细腻平滑,精准度也就越高,进而形成经验数据,有效提升火灾预警能力。同时,警方也不放过那些异常点,因为往往异常点代表着具有“人为纵火”嫌疑,警方再通过对这些异常点的分析,找出隐藏在火灾背后的案情。
Ø 聚类分析
不同于分类分析,聚类分析没有先验知识,一般是将一堆看似毫无规则的数据根据某种特征进行划分,不同属性的数据分到不同的组。警方可以根据时间或者空间为基准属性,对采集到的身份证号,报警信息,手机串号等进行分组,进而发现可疑线索。
例如,某文物保护单位午夜时分发生文物盗窃案件,通过对该单位近一周内的监控录像、手机串号等数据的采样,警方首先将可疑目标锁定在午夜时段出现的四个手机串号上,因为该时段不可能是正常游客参观时段,具有可疑性,但由于作案人带了头套和手套,未能取得有价值的作案监控录像。警方再对其余时间进行排查碰撞发现,在案发前三天,可疑目标手机串号出现在文物展览时段,通过对该时段的监控录像与手机串号进行排查定位,就可以有效缩小排查范围。
Ø 关联分析
用于在大量杂乱无章的数据中寻找有价值数据间的相关关系。
通过分析犯罪嫌疑人的基本信息、亲朋好友、交通工具、银行账户以及出行记录等,就能绘制出一张犯罪嫌疑人的关系网,进而为警方快速掌握犯罪嫌疑人动向提供有力线索。
■ 数据展示层
伴随着大数据应用而出现的技术还有可视化展示技术,它能够很直观的将大数据分析产生的晦涩难懂的数据以图表的形式展示出来,帮助警方根据图表特征快速研判。本模型针对警务案件研判特点,选取了几种常见的图表模型做展示。
Ø 关联关系图
关联关系图与关联分析算法配套使用,用于展示研判分析结果各元素之间的关系,该图将各元素分为中心元素和关联元素,关联元素围绕着中心元素展开。通常用于犯罪嫌疑主体与客体之间的关联关系。【注:中心元素和关联元素的要素类型可以相同,也可以不同】
Ø 时空时序图
通常与分类分析算法、聚类分析算法配合使用,按照时空属性,展示行为主体在一定时空范围内的行为轨迹,通常用于展示犯罪嫌疑人或嫌疑车辆的行为轨迹。
Ø 热点分布图
通常与聚类分析算法配合使用,用于碰撞挖掘人员行为习惯,关联关系以及异常行为之间的“共性”。
应用架构
基于物联网技术的警务大数据分析模型本身不能直接破案,但它可以帮助警方缩小排查范围,缩短排查用时。由于它需要整合多方信息资源,因此是一套跨部门,跨警种的分析应用模型。
■ 水平维度
警方在办案过程中经常会遇到多警种配合工作的情况,而各警种获取线索信息的渠道可能有所不同,导致对同一个目标元素得到不同的数据,这时就需要对大家获取的信息进行核实,并以某一个或多数人的信息为最终结论数据。(注:依靠物联网技术获取的数据会降低数据的差异性概率,但案件线索并非只有物联网采样数据,还有很多数据要通过其他渠道获得)
■ 垂直维度
在应用这套模型时,应该按照不同级别,职能分工使用。基层单位主要负责线索的采集,实际办案单位则肩负线索采集和分析研判过程,而省厅则作直接利用分析研判结果,对各区域的治安情况,警员的工作情况进行分析考核。
建设难点
虽然物联网、大数据已经不再是个陌生的技术,它也已经被广泛应用到各行各业,小到“物品标签”,大到“百度大数据分析计划”,似乎这两类技术无所不能,但事实上,要想充分发挥技术的优势,还需要一定的条件。
物联网,它被憧憬的应用形式之一便是连接城市,各种各样的传感器,视频监控无处不在,追中人们的行动并生成大量的数据,从而更高效的管理城市,但物联网技术的软硬件缺乏一个统一或者相对统一的标准,很难靠一家技术公司就能对接,整合各家的设备或系统。
大数据,一项伟大的发明,它将“星占卜”变成了“现实”,但从它的词意就可以知道,它的样本即全部,需要大量且非单一的数据做支撑,“共享”必不可少,但首先要解决各部门间的信息壁垒,以及跨公安网信息交互引起的信息安全问题。
文章总结
虽然笔者通过理论依据以及工作实践总结出了这套系统模型,但模型应用到实际,并构建出完整的可实用的软件系统仍然有很长一段路需要走,这需要公安干警以及相关行业技术从业者的共同努力。
技术手段不可能直接用于破案,但如果能够科学合理的应用,充分发挥它的作用,就能大大提升警方办案效率。而这些都是建立在完备的管理机制和人员认识之上的,需要警方、科学工作者以及社会共同的努力。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
DBeaver 实战:实现两个库表结构同步的高效路径 在数据库管理与开发工作中,保持不同环境(如开发库与生产库、主库与从库)的表 ...
2025-08-08t 检验与卡方检验:数据分析中的两大统计利器 在数据分析领域,统计检验是验证假设、挖掘数据规律的重要手段。其中,t 检验和卡 ...
2025-08-08CDA 数据分析师:解锁数据价值的专业力量 在当今这个数据爆炸的时代,数据已成为像石油一样珍贵的战略资源。而 CDA 数据分析师, ...
2025-08-08人工智能对CDA数据分析领域的影响 人工智能对 CDA(Certified Data Analyst,注册数据分析师)数据分析领域的影响是全方位、多层 ...
2025-08-07SPSS 语法使用详解 在当今数据驱动的时代,SPSS( Statistical Package for the Social Sciences)作为一款功能强大的统计分析软 ...
2025-08-07SASEM 决策树:理论与实践应用 在复杂的决策场景中,如何从海量数据中提取有效信息并制定科学决策,是各界关注的焦点。SASEM 决 ...
2025-08-07CDA含金量分析 在数字经济与人工智能深度融合的时代,数据驱动决策已成为企业核心竞争力的关键要素。CDA(Certified Data Analys ...
2025-08-07大数据时代对定性分析的影响 在大数据时代,海量、多样、高速且低价值密度的数据充斥着我们的生活与工作。而定性分析作为一 ...
2025-08-07K-S 曲线、回归与分类:数据分析中的重要工具 在数据分析与机器学习领域,K-S 曲线、回归和分类是三个核心概念与工具,它们各 ...
2025-08-07CDA 数据分析师考试全解析 在当今数字化时代,数据已成为企业发展的核心驱动力,数据分析师这一职业也愈发受到重视。CDA 数据分 ...
2025-08-07大数据时代的隐患:繁荣背后的隐忧 当我们在电商平台浏览商品时,系统总能 “精准” 推送心仪的物品;当我们刷短视频时,算法 ...
2025-08-07解析 F 边界检验:协整分析中的实用工具 在计量经济学的时间序列分析中,判断变量之间是否存在长期稳定的均衡关系(即协整关系) ...
2025-08-07CDA 数据分析师报考条件详解:迈向专业认证的指南 在数据分析行业蓬勃发展的当下,CDA 数据分析师认证成为众多从业者提升专业 ...
2025-08-07通过 COX 回归模型诊断异常值 一、COX 回归模型概述 COX 回归模型,又称比例风险回归模型,是一种用于生存分析的统计方法。它能 ...
2025-08-07评判两组数据与初始数据准确值的方法 在数据分析与研究中,我们常常会面临这样的情况:需要对通过不同方法、不同过程得到的两组 ...
2025-08-07CDA 数据分析师行业标准:构建数据人才的能力坐标系 在数据驱动决策成为企业核心竞争力的时代,CDA(数据分析师)行业标准作为 ...
2025-08-07反向传播神经网络:突破传统算法瓶颈的革命性力量 在人工智能发展的历史长河中,传统算法曾长期主导着数据处理与模式识别领域 ...
2025-08-07MySQL 统计连续每天数据:从业务需求到技术实现 在数据分析场景中,连续日期的数据统计是衡量业务连续性的重要手段 —— 无论是 ...
2025-08-07抖音数据分析师:驱动平台增长的幕后推手 在抖音这个日活用户数以亿计的超级平台上,每一次用户的滑动、点赞、评论,每一条 ...
2025-08-07基于 SPSS 的中介效应分析结果解读:揭示变量间的隐性关联 在社会科学与自然科学研究中,变量之间的关系往往并非简单的直接作用 ...
2025-08-07