京公网安备 11010802034615号
经营许可证编号:京B2-20210330
浅谈大数据和视频检索技术_数据分析师
近年来,大数据一词越来越多地被提及与使用,其含义是广泛的,涉及到各行业,我们正处在一个数据爆炸性增长的“大数据”时代,大数据对社会经济、政治、文化,人们生活等方面产生深远的影响,大数据对人类的数据驾驭能力提出了新的挑战与机遇。人们用大数据来描述和定义信息爆炸时代产生的海量数据。这些数据包括:移动互联、社交网络、电子商务、科学计算等等。其中视频又是构成大数据最大的一部分。
大数据的产生
根据相关机构的调查显示,全球监控摄像机市场在未来五年内将保持稳步增长,到2017年预计将上升到1亿台。仅视频监控录像而言,每天的数据量就达上千PB,累计的历史数据将更为庞大,由此也可以看出,监控视频在大数据体系中占有极大地位置。如今随着4K时代的到来,更高清的应用越来越普及,由此产生的数据将会越来越大,视频监控也将步入更高清的大数据井喷时代。
大数据技术之视频检索
“大数据或称巨量数据、海量数据、大资料,指的是所涉及的数据量规模巨大到无法通过人工,在合理时间内达到截取、管理、处理、并整理成为人类所能解读的信息。”维基百科对大数据的定义将大数据的特点阐释得非常清晰:“海量”和“非结构化”。这两个特点在视频监控行业尤为突出,如何在“海量”和“非结构化”的监控视频数据中快速找到对人们有用的信息变的尤为重要。
正是基于上述思考,视频检索技术应运而生。视频检索主要是依赖于视频算法对视频进行预处理,通过对视频内容进行结构化处理,提取出视频内容中的有效信息,进行标记或者相关处理后,人后可以通过各种属性描述进行快速检索。因此视频检索最主要的是利用视频检测算法对视频进行结构化描述,目前已经在相应的产品中得到应用的算法主要有以下几种:行为分析算法、车牌识别算法、车辆颜色识别算法、车标识别算法、车型识别算法、人脸检测识别算法、人体特征识别算法等。其中人体特征识别又包括人的年龄、性别、身高、衣服颜色、是否戴眼镜等特征信息的识别。视频检索技术在安防领域的重要作用是毋庸置疑的,其可以快速地从海量的数以万计的监控录像中,找到有用的关键信息,将为视频监控带来革命性的影响。
在视频检索技术出现之前,海量视频的分析一直是困扰人们的一个难题。据南方都市报报道,一个也门商人在广州打的丢行李,广州交通委花了两天的时间才从海量的出租车GPS信息和交通监控视频找到丢失的行李。面对如此多的监控数据,去寻找到证据和线索,无异于大海捞针,但目前的现实情况通常是被迫使用人海战术进行查看。一个案件的审看需要更为广泛的查看相关的摄像机视频,所审看的视频量时常达到数百上千小时。在目前的人工查看模式下,传统的方法需要从头到尾顺序播放,往往需要数倍于原始视频的时间才能审看完成,因此需要大量人员审看。为了规避遗漏和误差,很多刑侦队采用加大人力投入的方法,但是这种办法既影响了破案进度和效率,又使得工作人员疲惫不堪。如果有视频检索技术对视频中运动的物体等进行检索和排除,就能比较大的提高办案效率。
虽然视频检索技术在实际应用过程中,可以快速地从海量监控录像中找到一些有明显特征的人或物,但是技术所限,传统的检索方式显得比较单一,检索方式不够“智能”,这已经成为大型监控系统视频资料分析中的一个瓶颈。随着视频检索技术的不断发展,国家、企事业单位人力物力的大量投入,比如杭州海康威视数字技术股份有限公司着力于此应用的研发,并开发出视频检索系统,系统采用海康威视自主高效智能分析算法技术,保证分析信息的全面和准确,同时系统采用集群化计算方式,可提供几十上百倍实时以上的快速分析能力,并可根据应用需要进行线性扩展,提高计算能力。
本系统在视频资料录入的同时,就自动对视频中的目标信息进行格式归一化与智能预处理分析,对视频进行快速处理,提取视频中目标的相关信息作为智能元数据保存至数据库中。之后的相关操作,如智能审看、智能检索等等就不用再做复杂的解码以及智能分析的工作,而是直接从智能元数据中提取,大大的提高了工作效率。根据智能元数据信息,可对目标及目标细化特征等视频内容级别进行筛选,如颜色、人/车分类等。用户还可根据案情的需要自定义设置不同的周界防范规则,通过在数据库中对元数据进行检索提取触发规则的目标信息,达到快速检索的目的,极大地提高了效率。系统可以帮助刑侦人员高效、精准地聚焦到所关注的目标,有效解决目前视频众多、信息量巨大等视频查找的棘手问题,使通过视频调查取证不再费时和繁琐,提高办案民警的工作效率,达到科技强警的目的,符合公安部对于公安信息化建设的要求。
CDA学员免费下载查看报告全文:2026全球数智化人才指数报告【CDA数据科学研究院】.pdf
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数字化时代,数据已成为企业决策的核心驱动力,数据分析与数据挖掘作为解锁数据价值的关键手段,广泛应用于互联网、金融、医疗 ...
2026-04-17在数据处理、后端开发、报表生成与自动化脚本中,将 SQL 查询结果转换为字符串是一项高频且实用的操作。无论是拼接多行数据为逗 ...
2026-04-17面对一份上万行的销售明细表,要快速回答“哪个地区卖得最好”“哪款产品增长最快”“不同客户类型的购买力如何”——这些看似复 ...
2026-04-17数据分析师一天的工作,80% 的时间围绕表格结构数据展开。从一张销售明细表到一份完整的分析报告,表格结构数据贯穿始终。但你真 ...
2026-04-16在机器学习无监督学习领域,Kmeans聚类因其原理简洁、计算高效、可扩展性强的优势,成为数据聚类任务中的主流算法,广泛应用于用 ...
2026-04-16在机器学习建模实践中,特征工程是决定模型性能的核心环节之一。面对高维数据集,冗余特征、无关特征不仅会增加模型训练成本、延 ...
2026-04-16在数字化时代,用户是产品的核心资产,用户运营的本质的是通过科学的指标监测、分析与优化,实现“拉新、促活、留存、转化、复购 ...
2026-04-15在企业数字化转型、系统架构设计、数据治理与AI落地过程中,数据模型、本体模型、业务模型是三大核心基础模型,三者相互支撑、各 ...
2026-04-15数据分析师的一天,80%的时间花在表格数据上,但80%的坑也踩在表格数据上。 如果你分不清数值型和文本型的区别,不知道数据从哪 ...
2026-04-15在人工智能与机器学习落地过程中,模型质量直接决定了应用效果的优劣——无论是分类、回归、生成式模型,还是推荐、预测类模型, ...
2026-04-14在Python网络编程、接口测试、爬虫开发等场景中,HTTP请求的发送与响应处理是核心需求。Requests库作为Python生态中最流行的HTTP ...
2026-04-14 很多新人学完Python、SQL,拿到一张Excel表还是不知从何下手。 其实,90%的商业分析问题,都藏在表格的结构里。 ” 引言:为 ...
2026-04-14在回归分析中,因子(即自变量)的筛选是构建高效、可靠回归模型的核心步骤——实际分析场景中,往往存在多个候选因子,其中部分 ...
2026-04-13在机器学习模型开发过程中,过拟合是制约模型泛化能力的核心痛点——模型过度学习训练数据中的噪声与偶然细节,导致在训练集上表 ...
2026-04-13在数据驱动商业升级的今天,商业数据分析已成为企业精细化运营、科学决策的核心手段,而一套规范、高效的商业数据分析总体流程, ...
2026-04-13主讲人简介 张冲,海归统计学硕士,CDA 认证数据分析师,前云南白药集团资深数据分析师,自媒体 Python 讲师,全网课程播放量破 ...
2026-04-13在数据可视化与业务分析中,同比分析是衡量业务发展趋势、识别周期波动的核心手段,其核心逻辑是将当前周期数据与上年同期数据进 ...
2026-04-13在机器学习模型的落地应用中,预测精度并非衡量模型可靠性的唯一标准,不确定性分析同样不可或缺。尤其是在医疗诊断、自动驾驶、 ...
2026-04-10数据本身是沉默的,唯有通过有效的呈现方式,才能让其背后的规律、趋势与价值被看见、被理解、被运用。统计制图(数据可视化)作 ...
2026-04-10在全球化深度发展的今天,跨文化传播已成为连接不同文明、促进多元共生的核心纽带,其研究核心围绕“信息传递、文化解读、意义建 ...
2026-04-09