大数据时代 交通电子警察如何发展
随着大数据时代的来临,通过资料的收集、整理、分析、统计等方法,准确及时地掌握交通违法系统中各种动态、静态信息,提取交通违法行为在时间、空间、违法类型上的分布特征,可以从多个维度对交通违法数据进行分析,有助于探索出更加科学有效的交通违法治理科学方法,为非现场交通执法这一领域的发展提供有益的参考,以期更加富有成效地开展交通违法治理、维护道路交通秩序、预防和减少交通事故,为经济和社会发展创造和谐的道路交通环境。
1 交通违法数据分析基础
1.1 交通违法数据库概况
公安交通管理综合应用平台(通常称为“6合1平台”)是公安部推广的全国性应用平台,交通违法数据存储在该平台的交通违法数据库中,用到的数据库表包括:trff_app.vio_surveil(简称surveil表)、trff_app.vio_force(简称force表)和trff_app.vio_violation(简称violation表)。其中,surveil表记录了交通违法处理前的所有非现场执法数据;force表记录了交通违法处理前的所有一般程序执法数据(包括现场执法和非现场执法);violation表记录了交通违法处理前的所有简易程序的现场执法数据,同时,上述3个数据库表中的数据,在违法当事人办理完成交通违法处理手续后,都将进入到violation表中。3个数据库表之间的关系如下图所示:
数据库表关系图
1.2 可非现场执法的交通违法行为
根据《道路交通安全违法行为代码及处罚标准(2014年版)》,机动车驾驶人违法代码中,适用简易程序的违法代码有258种,适用一般程序的违法代码有113种,可以单独使用强制措施的违法代码16种(强制措施共105种,其中89种与简易程序或一般程序重复),合计共387种违法代码。按照现有市场上非现场执法设备的种类和发展水平,筛选出可以进行非现场执法的交通违法行为共92种,占机动车驾驶人违法行为总数的23.8%。可非现场执法交通违法行为主要集中在违反交通标志或标线(包含了压实线、不按导向车道行驶、不按规定车道行驶、逆行、倒车、进入禁行范围、超过规定时速、低于规定时速、停车等)和违反交通信号灯指示的违法行为。近年来由于高清摄像机、视频分析和大数据技术的发展,非现场执法在涉及司乘人员的违法行为(如不系安全带)、涉及号牌的违法行为(如遮挡号牌、污损号牌、不悬挂号牌等)方面有了进一步的突破。
2 交通违法数据分布特征
2.1 时间分布特征
通过统计广州市非现场执法数据的取证时间,可以发现,非现场执法数据在时间上的分布总体上具有以下特征:
日相似性:虽然每天的违法数据的变化趋势波形略有差异,但同一采集对象的曲线波形相似,变化趋势呈明显的周期性。在每天的同一时段,违法数据呈现出极其相似的变化趋势。
连续性:时间序列数据具有连续性,序列中的每一个采集数据对相邻时段的记录数据都有承上启下的特点(投入使用的电子警察数量发生变化除外)。
相对稳定性:在每一较短时段内,违法数据的时间变化趋势相对稳定。
执法主体相关性:非现场执法技术手段中,对违法行为的取证方式包括完全依靠设备和人工与设备结合两种。完全依靠设备的非现场执法量,节假日与工作日的差距非常小;而人工与设备结合的非现场执法量,节假日明显低于工作日。
流量相关性:排除执法主体的影响,只考察完全依靠设备的非现场执法量,在一天24小时中总体呈现为正态分布,其峰值主要出现在10时-16时之间。高峰时段为全天交通流量较大的时段,但并没有呈现早晚高峰的特征。
2.2 空间分布特征
考虑到交通违法量在空间上的分布,不仅与非现场执法量在空间上的分布有关,还与非现场执法点在空间上的分布有关,为了屏蔽非现场执法点数量在空间上分布不均对评价某区域交通违法严重程度的影响,定义“单位执法量=非现场执法量/非现场执法地点数量”来作为衡量指标。可以发现,非现场执法数据在空间上的分布总体上具有以下特征:
极不均匀性:非现场执法量在空间上的分布是极其不均匀的。占比80%的非现场执法量,发生在占违法地点总量15.6%的违法地点。 城郊差异性:郊区的单位执法量略高于城区的单位执法量。
道路级别差异性:单位执法量在道路级别上的分布按照高速公路、城市快速路、城市一般道路逐级递减。
2.3 违法行为分布特征
非现场执法数据在违法行为上的分布也体现出极不均匀的特征,占比84%的非现场执法量,发生在占比10%的违法行为上。
非现场执法量最为突出的交通违法行为是:违法停车、违反禁令标志、违反禁止标线、超速、闯红灯、不按导向车道行驶、违规使用专用车道。这一特征除了与交通违法行为自身的统计特征有关之外,还与现有非现场执法手段的技术可实现有关。例如,涉及号牌(包括未悬挂号牌、故意遮挡号牌、故意污损号牌等)的交通违法行为,现场执法量反映该违法行为也较为突出,但因技术手段原因,现阶段的非现场执法量几乎为零。
3 大数据环境下交通电子警察发展策略
电子警察是智能交通管理系统大框架中的重要组成部分,也是在对图像和视频数据进行语义化、结构化处理方面应用最深的领域。从技术角度,电子警察系统也是智能交通行业中率先引入大数据、云计算技术架构,突破数据应用瓶颈的一个技术领域。下一步,继续提高非现场执法比例、解放警力的途径,可以从以下3个方面考虑。
3.1 科学布局定点
当前国内几乎所有城市都拥有一定数量的电子警察,早期的电子警察布点“粗放式”的特征比较明显,这一特征只适合于电子警察系统建设的起步阶段,随着系统规模的逐步扩大和系统功能的日渐完善,也就对电子警察布点的科学性提出了更高的要求。需要进一步以管理需求为导向,以交通特征为标尺,兼顾交通安全管理、交通秩序管理和交通执法管理等方面的需求,综合考虑道路等级、交通区位、交通功能、交通运作特征等方面的客观条件,从交通执法数据所呈现出来的数据特征出发,分析评估当前电子警察布局的合理性,并将分析结果作为电子警察下一步建设和运行维护管理的指导意见,具体如下:
(1)对于现场执法量较大,而且该违法行为又可以采用非现场执法的,尽量采用非现场执法;
(2)加大已有非现场执法中设备自动采集取证的比例,将进行人工(或半自动)非现场执法的警力也解放出来;
(3)持续优化调整电子警察的点位,迁移改造社会效益不大且执法数量很少的电子警察。
3.2 持续提升智能化水平
目前,高清化、智能化的电子警察前端已成为主流,实时、自动地捕获进入特定范围的车辆,识别信号灯状态、识别车辆牌照,已经成为此类电子警察前端设备的标准配置。然而,现有的前端智能化水平还远不能满足交通管理实战应用的期望,智能化面临着新的挑战,主要体现在3个方面:一是综合识别率指标(包括捕获率、识别率等)的继续提升,从当前90%的要求,提升至95%甚至更高;二是外部场景适应性的提升,在电子警察的实际应用中,其算法需要进一步适应各种各样的自然环境变化,如强逆光、强顺光、强阴影、低照度、雨雪天、对向车辆远光灯等多种干扰因素,因此需要引入领先的机器学习和图像处理算法,通过收集现场某一类场景的场景对算法进行训练,最终将训练结果反馈到前端设备;三是增值特征识别与应用,大力拓展图像识别的目标范围,从单一的车牌识别过渡到车型、车标、年款、车身颜色、号牌颜色等多维度的车辆信息识别,以及驾驶人脸部特征、不系安全带、开车打电话等驾驶人信息识别,从而拓展非现场执法在“违法行为”维度的空间。
3.3 创新执法模式
在上文所述92中可非现场执法的交通违法类型中,“上道路行驶的机动车未悬挂机动车号牌的(1717)”、“故意遮挡机动车号牌的(1718)”、“故意污损机动车号牌的(1719)”、“不按规定安装机动车号牌的(1720)”这4种交通违法行为,属于涉牌违法行为,非现场执法难度较大。在大数据的时代背景下,通过创新执法模式,采用“设备提供线索信息、民警精准现场执法”这种线上和线下互动配合的方式,可以有效打击上述违法行为。具体是通过分析车辆通过电子警察的数据(包括治安卡口、和电子警察采集的数据,下一步可以扩展至停车场及高速公路收费站的数据),提取图像识别所提供的车型、车标、年款、车身颜色、号牌颜色等车辆信息,得出车辆的行驶轨迹。然后通过对目标车辆在一段时间内活动轨迹进行分析,可以判断出该车辆在某一范围的出现频度、时段,实现对单体行为习惯的有效预测,并将预测结果提供给路面民警,从而实现对违法车辆的精准现场执法。
4 结语
广州市交通电子警察系统经过16年的发展建设,已经形成了较大的规模,非现场执法也成为了交通执法的主力军,通过深度挖掘电子警察运行产生的各种数据,开展交通违法数据的统计、关联分析和评估,指导电子警察在布局定点、智能化方向、执法模式等方面的发展策略,大数据在广州市近几年的智能交通设施规划与评估中得到了较好地应用与实践。展望未来,智能交通设施评估将在交通安全、交通环境及交通运营等角度切入,进一步深化与拓展大数据分析评估技术。
数据分析咨询请扫描二维码
CDA数据分析师在中国航信高科技产业园进行了面向测试度量的数据分析培训课程,培训人数近2 ...
2024-05-01CDA数据分析师走进深圳迈瑞生物医疗电子股份有限公司,在迈瑞总部展开了为期两天的培训,本次课程参训人员线上及线下近百人, ...
2024-05-01CDA数据分析师在合肥市对合肥阳光新能源科技有限公司开展了为期8天的企业内训。 合肥阳光新能源科技 ...
2024-05-01CDA数据分析师走进海尔大学,进行了《数据治理与数据中台建设的道与术》专题培训,培训现场爆满,近百人参加了此次培训。 ...
2024-05-01在中国银行苏州分行培训中心开始数据分析师培训,此次培训课程共10天内容,包括Excel、MySQL、概率论与数理统计、SPSS等内容, ...
2024-05-01从实际的业务需求出发,结合行业的典型应用特点,围绕实际的商业问题,探讨数据挖掘、机器学习模型在金融领域的应用,包括获客、信用评分、细分画像、交叉销售、反欺诈、违规识别、时序预测、运筹优化、流程挖掘九个方面,形成 ...
2024-05-01本次培训课程为线上+线下的模式,由于学员编程能力不一、部分学员没有编程基础,故提供统计学、python基 ...
2024-05-01华夏银行信用卡中心-机器学习培训 1、课程亮点 取材于业界一流企业和顶级咨询公司的行业实践;已经被证明是人人 ...
2024-05-01主 题:数据中台建设及数据分析应用主题分享 1. 数据中台市场洞察 2. 主流数据中台产品比较 3. 某企业数据中 ...
2024-05-01围绕“数据驱动”战略,全力打造我行 300 人数字化人才梯队,着力培养数字化管理人才、大数据专业团队 ...
2024-05-01在当今数据驱动的商业环境中,数据分析成为了企业决策的重要依据。通过对大量数据的收集、处理和分析,企业能够更好地理解市场 ...
2024-04-29在人工智能(AI)的世界里,提示词(Prompt)是一种强大的工具,它能够引导AI按照用户的需求产生特定的输出。本文将深入探讨AI ...
2024-04-29CDA立足未来职场,拓展前沿视野——对外经贸大学保险学院举办“三全育人大讲堂”分享行业最新动态。 ...
2024-04-294月2日,CDA数据分析师创始发起人兼协会理事长赵坚毅博士受邀在浙江万里学院举办了一场以“数字化能力在职场中的作用” ...
2024-04-29随机森林(Random Forests)现在机器学习中比较火的一个算法,是一种基于Bagging的集成学习方法,能够很好地处理分类和回归的问 ...
2022-12-23方差分析是数据分析中常用的一种统计分析方法,接下来让我们简单了解一下方差分析的基本思想和原理吧。 方差分析(Analysis ...
2022-12-23来源:关于数据分析与可视化 关于streamlit-aggrid 数据排序 表格样式的调整 数据 ...
2022-08-03作者:麦叔 定义 「把上面晦涩的概念汇成一句话就是:」 ❝ 回调函数就是一个被作为参 ...
2022-08-03现今,高学历人群日益增多,物以稀为贵的高学历光环淡去。无论本科生还是研究生,甚至博士生,求职竞争力都大不如前,就业压力越来越大。
2022-06-01某家企业10个人面试,有9个本科生……如何脱颖而出,除得体的举止和良好的沟通力外,证书成重要筹码,这也是很多人考证的关键所在。
2022-04-14