
大数据助力交通行业进入4.0时代
日前,2017年中国“云上贵州”智慧交通大数据创新大赛在贵阳收关,535个项目经过激烈角逐,16个项目最终站上领奖台。从交通领域看,这些项目涉及公交线路优化、“绿通车”、出行行为预测、交通工程大数据等领域;从大数据角度着眼,物联网、数据挖掘、深度学习等大数据力量在交通全领域、全维度的渗透应用。16个参赛团队,直击交通行业痛点,描画智慧交通蓝图,分享175万的奖金。
“透过大赛可以看出,目前交通行业已经开始利用海量数据创造价值,这意味着交通行业已经开始进入4.0时代。”上海交通大学智能交通与无人机应用研究中心教授、长江学者彭仲仁告诉《中国科学报》记者。
“大赛旨在释放大数据的力量,升级智慧交通格局”, 大赛组织方,贵州省交通厅科技处处长康厚荣向记者表示,“通过大数据挖掘历史、把握现在、预测未来,创造了一个四维的智慧交通新图景。”
挖掘历史,大数据让高速公路更易管理
2016年6月云南警方,利用基于高速公路收费大数据的营运稽查系统,实现穿线,破获了一起篡改通行卡入口信息偷逃费大案,打掉制卡团伙4个,涉案车辆1652辆,涉案金额2250万。
“早在2015年,云南省出入口日车流量就已经超过160万,传统稽查早已力不从心” ,参赛选手孙秀珍表示,“于是我们设计了一个新的基于大数据的高速运营稽查系统。”
该系统通过流处理、Hadoop分布式并行数据处理、内存计算等先进大数据技术,整合了高速的全维度数据,利用神经网络技术,对偷逃费车辆精准画像,训练优化出30余种偷逃费模型。
“没想到系统刚刚投入使用就发现了,高速通信卡编号、时间不匹配的问题于是我们通过历史数据的回溯,挖出了这起大案。” 孙秀珍表示。
除了能穿越破大案,大赛的项目还解决了“绿通车”逃费问题。“绿色通道”是国家采取的一项免收农副产品运输车辆过路费的政策。但是有一部分人却在农副产品中混装其它货物逃避过路费。
“稽查‘绿通车’不仅耗费大量的人力物力,还会造成收费站专用道路拥堵,通行能力降低,导致蔬菜等生鲜变质,如果不稽查又面临海量的高速收费流失。”贵州省高速公路集团杨莹告诉记者。
本次大赛参赛项目高速公路绿色通道“空中查验”诚信管理平台用历史回溯的方式让收费站工作人员全维度了解“绿通车”运行历史,试图解决该问题。
绿通车司机需要下载一个具有防伪拍照技术专用的APP,按要求记录车辆的装载货物的场景,APP将自动记录和识别装货时间、行驶路径、货品类别等多维数据;在车辆到达收费站时,收费站工作人员将结合该车辆历史画像利用大数据技术空中查验“绿通车”,精准感知车辆类型,快速放行真正“绿通车辆”。
把握现在,大数据让事故监测实时准确
在2014年3月,两辆甲醇运输车辆在晋济高速山西晋城岩后隧道追尾,并引发连环事故,造成40人死亡、12人受伤。
“从事故发生到事故发现我们整整花费了20分钟,如果我们能在第一时间发现事故、准确掌握隧道中的人车情况就可能制定出合理的解决方案,2014年的悲剧就不会那么惨痛。”参赛选手吕超说,“我们参赛项目‘慧眼识交通’就是在这次事故后研发的。”
吕超与团队一起,研发了一套深度学习算法及多任务神经网络模型,系统只需4个月的训练,就可以秒级报警隧道交通事故、交通违章、拥堵等异常事件,确认异常事件地点、车型、隧道行人等情况,识别准确率高达99.6%。
“‘慧眼识交通’已经达到了全国乃至世界领先水平” 吕超说,“有了‘慧眼识交通’高速检测员将秒级监控隧道状况,实时反应,第一时间发现并定位事故。”
另一个参赛项目“慧眼达”与“慧眼识交通”同是利用视频数据的高速公路异常事件监测平台,但是“慧眼达”更擅长全路网、全场景的实时监测。
据介绍,“慧眼达”利用深度学习技术和熵值突变模型对各路网运行态势进行监测和预测、异常事件进行精准识别和实时报警。哪怕在极端环境下、公路摄像头盲区,也可以通过自适应场景切换的目标识别技术和路网运行间接预测模型实现路运行态势实时监测。
预测未来,大数据让城轨轻松调度
广州地铁的城轨调度员可能是天下最幸福的调度员,因为他们可以“看到”未来。
城轨调度员利用‘城轨客流多维智能预测平台’的可视化屏幕可以轻松看到未来5分钟、10分钟、1小时乃至1周、1个月的每个地铁口的进出站量、站间客流分布、客流和换乘量,哪怕遇见节假日、极端天气、新地铁线运行也丝毫不形象准确度。这城轨调度员更合理、更轻松的调度城轨运行。
“能做到跑的比时间快,是因为我们融合分析了海量历史数据。”参赛选手,“城轨客流多维智能预测平台”项目负责人郇宁表示,“我们将城轨刷卡数据、城轨运行数据、出行行为数据,POI数据、换乘数据、气象数据集合起来,建立了9种预测模型,实现了对城轨客流进行多粒度、多场景、多指标的精确预测。”
除了预测平台,新的预测算法也频繁出现在本次大赛中。
非常态路网流预测算法研究项目设计了一种新的流量预测算法,这种算法基于相同属性下非常态交通流量变化呈现趋势高度重复的特性将路网流量分解为反映数据趋势的基准和反映数据相对于基准序列的偏离两部分,基于相似模式分别预测,之后叠加。经过验证,它与传统算法相比准确率提高了3-5%。
“本次大赛是中国智慧交通发展的一面镜子,在这面镜子里,有中国交通的未来。”贵州师范大学副校长谢晓尧表示。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23在数据分析全流程中,“数据清洗” 恰似烹饪前的食材处理:若食材(数据)腐烂变质、混杂异物(脏数据),即便拥有精湛的烹饪技 ...
2025-10-23在人工智能领域,“大模型” 已成为近年来的热点标签:从参数超 1750 亿的 GPT-3,到万亿级参数的 PaLM,再到多模态大模型 GPT-4 ...
2025-10-22在 MySQL 数据库的日常运维与开发中,“更新数据是否会影响读数据” 是一个高频疑问。这个问题的答案并非简单的 “是” 或 “否 ...
2025-10-22在企业数据分析中,“数据孤岛” 是制约分析深度的核心瓶颈 —— 用户数据散落在注册系统、APP 日志、客服记录中,订单数据分散 ...
2025-10-22在神经网络设计中,“隐藏层个数” 是决定模型能力的关键参数 —— 太少会导致 “欠拟合”(模型无法捕捉复杂数据规律,如用单隐 ...
2025-10-21在特征工程流程中,“单变量筛选” 是承上启下的关键步骤 —— 它通过分析单个特征与目标变量的关联强度,剔除无意义、冗余的特 ...
2025-10-21在数据分析全流程中,“数据读取” 常被误解为 “简单的文件打开”—— 双击 Excel、执行基础 SQL 查询即可完成。但对 CDA(Cert ...
2025-10-21在实际业务数据分析中,我们遇到的大多数数据并非理想的正态分布 —— 电商平台的用户消费金额(少数用户单次消费上万元,多数集 ...
2025-10-20在数字化交互中,用户的每一次操作 —— 从电商平台的 “浏览商品→加入购物车→查看评价→放弃下单”,到内容 APP 的 “点击短 ...
2025-10-20在数据分析的全流程中,“数据采集” 是最基础也最关键的环节 —— 如同烹饪前需备好新鲜食材,若采集的数据不完整、不准确或不 ...
2025-10-20在数据成为新时代“石油”的今天,几乎每个职场人都在焦虑: “为什么别人能用数据驱动决策、升职加薪,而我面对Excel表格却无从 ...
2025-10-18数据清洗是 “数据价值挖掘的前置关卡”—— 其核心目标是 “去除噪声、修正错误、规范格式”,但前提是不破坏数据的真实业务含 ...
2025-10-17在数据汇总分析中,透视表凭借灵活的字段重组能力成为核心工具,但原始透视表仅能呈现数值结果,缺乏对数据背景、异常原因或业务 ...
2025-10-17在企业管理中,“凭经验定策略” 的传统模式正逐渐失效 —— 金融机构靠 “研究员主观判断” 选股可能错失收益,电商靠 “运营拍 ...
2025-10-17在数据库日常操作中,INSERT INTO SELECT是实现 “批量数据迁移” 的核心 SQL 语句 —— 它能直接将一个表(或查询结果集)的数 ...
2025-10-16在机器学习建模中,“参数” 是决定模型效果的关键变量 —— 无论是线性回归的系数、随机森林的树深度,还是神经网络的权重,这 ...
2025-10-16在数字化浪潮中,“数据” 已从 “辅助决策的工具” 升级为 “驱动业务的核心资产”—— 电商平台靠用户行为数据优化推荐算法, ...
2025-10-16在大模型从实验室走向生产环境的过程中,“稳定性” 是决定其能否实用的关键 —— 一个在单轮测试中表现优异的模型,若在高并发 ...
2025-10-15