京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据时代 交通电子警察如何发展
随着大数据时代的来临,通过资料的收集、整理、分析、统计等方法,准确及时地掌握交通违法系统中各种动态、静态信息,提取交通违法行为在时间、空间、违法类型上的分布特征,可以从多个维度对交通违法数据进行分析,有助于探索出更加科学有效的交通违法治理科学方法,为非现场交通执法这一领域的发展提供有益的参考,以期更加富有成效地开展交通违法治理、维护道路交通秩序、预防和减少交通事故,为经济和社会发展创造和谐的道路交通环境。
1 交通违法数据分析基础
1.1 交通违法数据库概况
公安交通管理综合应用平台(通常称为“6合1平台”)是公安部推广的全国性应用平台,交通违法数据存储在该平台的交通违法数据库中,用到的数据库表包括:trff_app.vio_surveil(简称surveil表)、trff_app.vio_force(简称force表)和trff_app.vio_violation(简称violation表)。其中,surveil表记录了交通违法处理前的所有非现场执法数据;force表记录了交通违法处理前的所有一般程序执法数据(包括现场执法和非现场执法);violation表记录了交通违法处理前的所有简易程序的现场执法数据,同时,上述3个数据库表中的数据,在违法当事人办理完成交通违法处理手续后,都将进入到violation表中。3个数据库表之间的关系如下图所示:
数据库表关系图
1.2 可非现场执法的交通违法行为
根据《道路交通安全违法行为代码及处罚标准(2014年版)》,机动车驾驶人违法代码中,适用简易程序的违法代码有258种,适用一般程序的违法代码有113种,可以单独使用强制措施的违法代码16种(强制措施共105种,其中89种与简易程序或一般程序重复),合计共387种违法代码。按照现有市场上非现场执法设备的种类和发展水平,筛选出可以进行非现场执法的交通违法行为共92种,占机动车驾驶人违法行为总数的23.8%。可非现场执法交通违法行为主要集中在违反交通标志或标线(包含了压实线、不按导向车道行驶、不按规定车道行驶、逆行、倒车、进入禁行范围、超过规定时速、低于规定时速、停车等)和违反交通信号灯指示的违法行为。近年来由于高清摄像机、视频分析和大数据技术的发展,非现场执法在涉及司乘人员的违法行为(如不系安全带)、涉及号牌的违法行为(如遮挡号牌、污损号牌、不悬挂号牌等)方面有了进一步的突破。
2 交通违法数据分布特征
2.1 时间分布特征
通过统计广州市非现场执法数据的取证时间,可以发现,非现场执法数据在时间上的分布总体上具有以下特征:
日相似性:虽然每天的违法数据的变化趋势波形略有差异,但同一采集对象的曲线波形相似,变化趋势呈明显的周期性。在每天的同一时段,违法数据呈现出极其相似的变化趋势。
连续性:时间序列数据具有连续性,序列中的每一个采集数据对相邻时段的记录数据都有承上启下的特点(投入使用的电子警察数量发生变化除外)。
相对稳定性:在每一较短时段内,违法数据的时间变化趋势相对稳定。
执法主体相关性:非现场执法技术手段中,对违法行为的取证方式包括完全依靠设备和人工与设备结合两种。完全依靠设备的非现场执法量,节假日与工作日的差距非常小;而人工与设备结合的非现场执法量,节假日明显低于工作日。
流量相关性:排除执法主体的影响,只考察完全依靠设备的非现场执法量,在一天24小时中总体呈现为正态分布,其峰值主要出现在10时-16时之间。高峰时段为全天交通流量较大的时段,但并没有呈现早晚高峰的特征。
2.2 空间分布特征
考虑到交通违法量在空间上的分布,不仅与非现场执法量在空间上的分布有关,还与非现场执法点在空间上的分布有关,为了屏蔽非现场执法点数量在空间上分布不均对评价某区域交通违法严重程度的影响,定义“单位执法量=非现场执法量/非现场执法地点数量”来作为衡量指标。可以发现,非现场执法数据在空间上的分布总体上具有以下特征:
极不均匀性:非现场执法量在空间上的分布是极其不均匀的。占比80%的非现场执法量,发生在占违法地点总量15.6%的违法地点。 城郊差异性:郊区的单位执法量略高于城区的单位执法量。
道路级别差异性:单位执法量在道路级别上的分布按照高速公路、城市快速路、城市一般道路逐级递减。
2.3 违法行为分布特征
非现场执法数据在违法行为上的分布也体现出极不均匀的特征,占比84%的非现场执法量,发生在占比10%的违法行为上。
非现场执法量最为突出的交通违法行为是:违法停车、违反禁令标志、违反禁止标线、超速、闯红灯、不按导向车道行驶、违规使用专用车道。这一特征除了与交通违法行为自身的统计特征有关之外,还与现有非现场执法手段的技术可实现有关。例如,涉及号牌(包括未悬挂号牌、故意遮挡号牌、故意污损号牌等)的交通违法行为,现场执法量反映该违法行为也较为突出,但因技术手段原因,现阶段的非现场执法量几乎为零。
3 大数据环境下交通电子警察发展策略
电子警察是智能交通管理系统大框架中的重要组成部分,也是在对图像和视频数据进行语义化、结构化处理方面应用最深的领域。从技术角度,电子警察系统也是智能交通行业中率先引入大数据、云计算技术架构,突破数据应用瓶颈的一个技术领域。下一步,继续提高非现场执法比例、解放警力的途径,可以从以下3个方面考虑。
3.1 科学布局定点
当前国内几乎所有城市都拥有一定数量的电子警察,早期的电子警察布点“粗放式”的特征比较明显,这一特征只适合于电子警察系统建设的起步阶段,随着系统规模的逐步扩大和系统功能的日渐完善,也就对电子警察布点的科学性提出了更高的要求。需要进一步以管理需求为导向,以交通特征为标尺,兼顾交通安全管理、交通秩序管理和交通执法管理等方面的需求,综合考虑道路等级、交通区位、交通功能、交通运作特征等方面的客观条件,从交通执法数据所呈现出来的数据特征出发,分析评估当前电子警察布局的合理性,并将分析结果作为电子警察下一步建设和运行维护管理的指导意见,具体如下:
(1)对于现场执法量较大,而且该违法行为又可以采用非现场执法的,尽量采用非现场执法;
(2)加大已有非现场执法中设备自动采集取证的比例,将进行人工(或半自动)非现场执法的警力也解放出来;
(3)持续优化调整电子警察的点位,迁移改造社会效益不大且执法数量很少的电子警察。
3.2 持续提升智能化水平
目前,高清化、智能化的电子警察前端已成为主流,实时、自动地捕获进入特定范围的车辆,识别信号灯状态、识别车辆牌照,已经成为此类电子警察前端设备的标准配置。然而,现有的前端智能化水平还远不能满足交通管理实战应用的期望,智能化面临着新的挑战,主要体现在3个方面:一是综合识别率指标(包括捕获率、识别率等)的继续提升,从当前90%的要求,提升至95%甚至更高;二是外部场景适应性的提升,在电子警察的实际应用中,其算法需要进一步适应各种各样的自然环境变化,如强逆光、强顺光、强阴影、低照度、雨雪天、对向车辆远光灯等多种干扰因素,因此需要引入领先的机器学习和图像处理算法,通过收集现场某一类场景的场景对算法进行训练,最终将训练结果反馈到前端设备;三是增值特征识别与应用,大力拓展图像识别的目标范围,从单一的车牌识别过渡到车型、车标、年款、车身颜色、号牌颜色等多维度的车辆信息识别,以及驾驶人脸部特征、不系安全带、开车打电话等驾驶人信息识别,从而拓展非现场执法在“违法行为”维度的空间。
3.3 创新执法模式
在上文所述92中可非现场执法的交通违法类型中,“上道路行驶的机动车未悬挂机动车号牌的(1717)”、“故意遮挡机动车号牌的(1718)”、“故意污损机动车号牌的(1719)”、“不按规定安装机动车号牌的(1720)”这4种交通违法行为,属于涉牌违法行为,非现场执法难度较大。在大数据的时代背景下,通过创新执法模式,采用“设备提供线索信息、民警精准现场执法”这种线上和线下互动配合的方式,可以有效打击上述违法行为。具体是通过分析车辆通过电子警察的数据(包括治安卡口、和电子警察采集的数据,下一步可以扩展至停车场及高速公路收费站的数据),提取图像识别所提供的车型、车标、年款、车身颜色、号牌颜色等车辆信息,得出车辆的行驶轨迹。然后通过对目标车辆在一段时间内活动轨迹进行分析,可以判断出该车辆在某一范围的出现频度、时段,实现对单体行为习惯的有效预测,并将预测结果提供给路面民警,从而实现对违法车辆的精准现场执法。
4 结语
广州市交通电子警察系统经过16年的发展建设,已经形成了较大的规模,非现场执法也成为了交通执法的主力军,通过深度挖掘电子警察运行产生的各种数据,开展交通违法数据的统计、关联分析和评估,指导电子警察在布局定点、智能化方向、执法模式等方面的发展策略,大数据在广州市近几年的智能交通设施规划与评估中得到了较好地应用与实践。展望未来,智能交通设施评估将在交通安全、交通环境及交通运营等角度切入,进一步深化与拓展大数据分析评估技术。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在MySQL数据库日常查询、数据统计、后台接口开发、数据导出等场景中,开发者经常需要查询数据表除某几列之外的所有字段。例如查 ...
2026-06-09在Python网络请求、爬虫开发、接口测试、数据抓取等实操场景中,requests库是最常用的第三方请求工具,而content属性是requests ...
2026-06-09 数据分析正在重塑每一个行业。CDA认证的三本官方教材,分别对应Level I、Level II、Level III,为你铺就从业务数据分析到数 ...
2026-06-09在数字财务、智慧财税、业财融合深度推进的当下,传统财务模式下数据标准混乱、业务流程碎片化、知识无法沉淀、系统互通性差等问 ...
2026-06-08随着数字经济深度渗透各行各业,数据正式成为继土地、劳动力、资本、技术之后的第五大生产要素,是企业数字化转型、精细化运营、 ...
2026-06-08 很多数据分析师能熟练写SQL、做透视表,但当被问到“数据是从哪里来的?经过哪些加工才进入数据仓库?ETL具体做了什么?”时 ...
2026-06-08【核心关键词】贷款、报表、课程、专业、建模、缺失值、营销、互联网、银行、办公自动化、数据分析、数据预处理、特征工程、贷 ...
2026-06-05在数据库数据查询、业务报表统计、多表关联分析中,LEFT JOIN左连接是使用率最高的SQL关联查询语句。其核心特性是保留左表全部数 ...
2026-06-05 很多数据分析师能熟练地写SQL、做透视表、算描述性统计,但当被问到“如何预测用户流失概率”“如何归因销量下滑的关键因素 ...
2026-06-05任何一款产品从诞生、普及到最终退出市场,都会遵循一套固定的发展规律,这就是产品生命周期理论。在市场竞争日益激烈、产品迭代 ...
2026-06-04在Excel数据分析、办公统计、业务报表制作场景中,数据透视表是数据汇总、分类统计、快速复盘的核心工具,能够高效完成海量原始 ...
2026-06-04 很多数据分析师拿到数据就开始清洗、建模,但当被问到“这批数据属于什么类型——结构化还是非结构化?分类变量还是数值变量 ...
2026-06-04在问卷调查与社会科学数据分析中,卡方检验是最常用、最基础的非参数检验方法,广泛应用于市场调研、用户分析、行为统计、满意度 ...
2026-06-03【核心关键词】贷款、报表、课程、专业、建模、缺失值、营销、互联网、银行、办公自动化、数据分析、数据预处理、特征工程、贷 ...
2026-06-03 很多数据分析师画过趋势图、做过业绩预测,但当被问到“这个月销售额增长20%,到底是长期趋势自然增长,还是促销活动的短期 ...
2026-06-03逻辑回归是数据分析、机器学习、统计建模中应用最广泛的二分类预测模型,常用于风险判断、行为预测、归因分析等场景。在SPSS、Py ...
2026-06-02数字经济时代,市场竞争日趋同质化,用户消费需求愈发个性化、多元化,传统依托经验、粗放式、广撒网的营销模式弊端日益凸显。长 ...
2026-06-02 很多数据分析师做过按月份的销售额趋势图,画过按天的流量折线图,但当被问到“时间序列和普通数据有什么本质区别”“季节性 ...
2026-06-02在市场竞争日趋饱和、用户需求不断细分的当下,企业创业创新、产品迭代与市场拓展不再依赖经验决策,而是需要系统化、工具化的商 ...
2026-06-01【核心关键词】调度、岗位、数据库、企业、报表、培训、程序、数据分析、数据加工、业务部门、企业数据、调度工具、业务指标、 ...
2026-06-01