京公网安备 11010802034615号
经营许可证编号:京B2-20210330
浅谈大数据和视频检索技术_数据分析师
近年来,大数据一词越来越多地被提及与使用,其含义是广泛的,涉及到各行业,我们正处在一个数据爆炸性增长的“大数据”时代,大数据对社会经济、政治、文化,人们生活等方面产生深远的影响,大数据对人类的数据驾驭能力提出了新的挑战与机遇。人们用大数据来描述和定义信息爆炸时代产生的海量数据。这些数据包括:移动互联、社交网络、电子商务、科学计算等等。其中视频又是构成大数据最大的一部分。
大数据的产生
根据相关机构的调查显示,全球监控摄像机市场在未来五年内将保持稳步增长,到2017年预计将上升到1亿台。仅视频监控录像而言,每天的数据量就达上千PB,累计的历史数据将更为庞大,由此也可以看出,监控视频在大数据体系中占有极大地位置。如今随着4K时代的到来,更高清的应用越来越普及,由此产生的数据将会越来越大,视频监控也将步入更高清的大数据井喷时代。
大数据技术之视频检索
“大数据或称巨量数据、海量数据、大资料,指的是所涉及的数据量规模巨大到无法通过人工,在合理时间内达到截取、管理、处理、并整理成为人类所能解读的信息。”维基百科对大数据的定义将大数据的特点阐释得非常清晰:“海量”和“非结构化”。这两个特点在视频监控行业尤为突出,如何在“海量”和“非结构化”的监控视频数据中快速找到对人们有用的信息变的尤为重要。
正是基于上述思考,视频检索技术应运而生。视频检索主要是依赖于视频算法对视频进行预处理,通过对视频内容进行结构化处理,提取出视频内容中的有效信息,进行标记或者相关处理后,人后可以通过各种属性描述进行快速检索。因此视频检索最主要的是利用视频检测算法对视频进行结构化描述,目前已经在相应的产品中得到应用的算法主要有以下几种:行为分析算法、车牌识别算法、车辆颜色识别算法、车标识别算法、车型识别算法、人脸检测识别算法、人体特征识别算法等。其中人体特征识别又包括人的年龄、性别、身高、衣服颜色、是否戴眼镜等特征信息的识别。视频检索技术在安防领域的重要作用是毋庸置疑的,其可以快速地从海量的数以万计的监控录像中,找到有用的关键信息,将为视频监控带来革命性的影响。
在视频检索技术出现之前,海量视频的分析一直是困扰人们的一个难题。据南方都市报报道,一个也门商人在广州打的丢行李,广州交通委花了两天的时间才从海量的出租车GPS信息和交通监控视频找到丢失的行李。面对如此多的监控数据,去寻找到证据和线索,无异于大海捞针,但目前的现实情况通常是被迫使用人海战术进行查看。一个案件的审看需要更为广泛的查看相关的摄像机视频,所审看的视频量时常达到数百上千小时。在目前的人工查看模式下,传统的方法需要从头到尾顺序播放,往往需要数倍于原始视频的时间才能审看完成,因此需要大量人员审看。为了规避遗漏和误差,很多刑侦队采用加大人力投入的方法,但是这种办法既影响了破案进度和效率,又使得工作人员疲惫不堪。如果有视频检索技术对视频中运动的物体等进行检索和排除,就能比较大的提高办案效率。
虽然视频检索技术在实际应用过程中,可以快速地从海量监控录像中找到一些有明显特征的人或物,但是技术所限,传统的检索方式显得比较单一,检索方式不够“智能”,这已经成为大型监控系统视频资料分析中的一个瓶颈。随着视频检索技术的不断发展,国家、企事业单位人力物力的大量投入,比如杭州海康威视数字技术股份有限公司着力于此应用的研发,并开发出视频检索系统,系统采用海康威视自主高效智能分析算法技术,保证分析信息的全面和准确,同时系统采用集群化计算方式,可提供几十上百倍实时以上的快速分析能力,并可根据应用需要进行线性扩展,提高计算能力。
本系统在视频资料录入的同时,就自动对视频中的目标信息进行格式归一化与智能预处理分析,对视频进行快速处理,提取视频中目标的相关信息作为智能元数据保存至数据库中。之后的相关操作,如智能审看、智能检索等等就不用再做复杂的解码以及智能分析的工作,而是直接从智能元数据中提取,大大的提高了工作效率。根据智能元数据信息,可对目标及目标细化特征等视频内容级别进行筛选,如颜色、人/车分类等。用户还可根据案情的需要自定义设置不同的周界防范规则,通过在数据库中对元数据进行检索提取触发规则的目标信息,达到快速检索的目的,极大地提高了效率。系统可以帮助刑侦人员高效、精准地聚焦到所关注的目标,有效解决目前视频众多、信息量巨大等视频查找的棘手问题,使通过视频调查取证不再费时和繁琐,提高办案民警的工作效率,达到科技强警的目的,符合公安部对于公安信息化建设的要求。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在回归分析的结果解读中,R方(决定系数)是衡量模型拟合效果的核心指标——它代表因变量的变异中能被自变量解释的比例,取值通 ...
2025-12-04在城市规划、物流配送、文旅分析等场景中,经纬度热力图是解读空间数据的核心工具——它能将零散的GPS坐标(如外卖订单地址、景 ...
2025-12-04在CDA(Certified Data Analyst)数据分析师的指标体系中,“通用指标”与“场景指标”并非相互割裂的两个部分,而是支撑业务分 ...
2025-12-04每到“双十一”,电商平台的销售额会迎来爆发式增长;每逢冬季,北方的天然气消耗量会显著上升;每月的10号左右,工资发放会带动 ...
2025-12-03随着数字化转型的深入,企业面临的数据量呈指数级增长——电商的用户行为日志、物联网的传感器数据、社交平台的图文视频等,这些 ...
2025-12-03在CDA(Certified Data Analyst)数据分析师的工作体系中,“指标”是贯穿始终的核心载体——从“销售额环比增长15%”的业务结论 ...
2025-12-03在神经网络训练中,损失函数的数值变化常被视为模型训练效果的“核心仪表盘”——初学者盯着屏幕上不断下降的损失值满心欢喜,却 ...
2025-12-02在CDA(Certified Data Analyst)数据分析师的日常工作中,“用部分数据推断整体情况”是高频需求——从10万条订单样本中判断全 ...
2025-12-02在数据预处理的纲量统一环节,标准化是消除量纲影响的核心手段——它将不同量级的特征(如“用户年龄”“消费金额”)转化为同一 ...
2025-12-02在数据驱动决策成为企业核心竞争力的今天,A/B测试已从“可选优化工具”升级为“必选验证体系”。它通过控制变量法构建“平行实 ...
2025-12-01在时间序列预测任务中,LSTM(长短期记忆网络)凭借对时序依赖关系的捕捉能力成为主流模型。但很多开发者在实操中会遇到困惑:用 ...
2025-12-01引言:数据时代的“透视镜”与“掘金者” 在数字经济浪潮下,数据已成为企业决策的核心资产,而CDA数据分析师正是挖掘数据价值的 ...
2025-12-01数据分析师的日常,常始于一堆“毫无章法”的数据点:电商后台导出的零散订单记录、APP埋点收集的无序用户行为日志、传感器实时 ...
2025-11-28在MySQL数据库运维中,“query end”是查询执行生命周期的收尾阶段,理论上耗时极短——主要完成结果集封装、资源释放、事务状态 ...
2025-11-28在CDA(Certified Data Analyst)数据分析师的工具包中,透视分析方法是处理表结构数据的“瑞士军刀”——无需复杂代码,仅通过 ...
2025-11-28在统计分析中,数据的分布形态是决定“用什么方法分析、信什么结果”的底层逻辑——它如同数据的“性格”,直接影响着描述统计的 ...
2025-11-27在电商订单查询、用户信息导出等业务场景中,技术人员常面临一个选择:是一次性查询500条数据,还是分5次每次查询100条?这个问 ...
2025-11-27对数据分析从业者和学生而言,表结构数据是最基础也最核心的分析载体——CRM系统的用户表、门店的销售明细表、仓库的库存表,都 ...
2025-11-27在业务数据可视化中,热力图(Heat Map)是传递“数据密度与分布特征”的核心工具——它通过颜色深浅直观呈现数据值的高低,让“ ...
2025-11-26在企业数字化转型中,业务数据分析师是连接数据与决策的核心纽带。但“数据分析师”并非单一角色,从初级到高级,其职责边界、能 ...
2025-11-26