
大数据在视频监控存储的应用与挑战
面对大数据,视频监控行业面临哪些难题?我们如何应用云计算、大数据相关技术来获取数据背后隐含的信息?未来的挑战和前景如何?我将从以上几方面发表个人观...
面对大数据,视频监控行业面临哪些难题?我们如何应用云计算、大数据相关技术来获取数据背后隐含的信息?未来的挑战和前景如何?我将从以上几方面发表个人观点,意在抛砖引玉、引发业界同仁在产业发展的进一步思考和讨论。
1.视频监控存储及智能分析系统中的难题
根据IDC预测,全球在2010年已正式进入ZB时代,全球数据量大约每两年翻一番,意味着人类在最近两年产生的数据量相当于之前产生的全部数据量。爆炸式增长的数据,正推动人类进入大数据的时代。
大数据包括社交媒体、移动设备、科学计算和城市中部署的各类传感器信息,其中视频是构成数据体量最大的组成部分。据IMS Research统计,2011年全球摄像头的出货量达到2646万台,预计到2015年摄像头出货量达5454万台。一天产生的视频监控数据超过1500PB,而累计历史数据将更为庞大,在视频监控大联网、高清化推动下,视频监控业务将面临海量非结构化数据存储、数据共享、数据安全及数据利用四大难题。
(1)海量非结构化数据存储
安防行业的大数据目前主要来源于智慧城市和智能交通等大型安防项目。例如,2011年全球两天的数据就高达1.8ZB,相当于文明起始到21世纪初全部的数据总和;2013年中国某一线城市一个季度产生的数据总量也在200PB。当前,智慧城市建设已成为地方政府推进城镇化发展的重要途径,而随着智慧城市的发展,对高清摄像机和智能化监控设备的需求会持续增长,智能交通行业将成为十二五政府投资的重点领域,这将使未来几年视频监控行业仍保持高景气度。此外随着智能家居、民用安防的普及,更多的用户会通过移动设备监看视频,于此同时会有更多的移动互联数据产生。2012年全国就拥有3.88亿移动互联网用户,预计2015年互联设备将达到150亿,2020年互联设备将达到2000亿。数据10倍速的增长,在带来巨大机遇的同时,也带来了很大的挑战。
按照IT产业的法则:在满足客户需求的前提之下,往往技术成本越低,其生命力往往越强。由于数据量的急速扩大,以及随之而来的大规模计算的需求越来越多,一味采用高配硬件,使得硬件投资成为客户不可承受之重。如何在满足需求的前提下,删除重复数据、降低硬件成本投资将成为海量非结构化数据存储的一个难题。
(2)数据共享
大数据需要通过快速的采集、发现和分析,从大量化、多类别的数据中提取价值。安防大数据时代最显著的特征就是海量和非结构化数据共享,用以提高数据处理能力。比如天网工程和智能交通就是最具代表性的案例,天网工程一般分为省市县乡镇等多级架构,智能交通图像也分布在前端卡口、区节点、市省国家级中心中,海量数据存储在不同节点、不同设备中,这给传统的数据管理和使用机制带来了极大的挑战。
与科学计算、互联网相比,视频监控的大数据处理难度尤大,首先,视频录像是更原始的非文本非结构化的数据,必须经过复杂繁重的分析处理才能提取出文本结构化的数据进行下一步处理;其次视频录像相对其它形式数据的容量要大几个数量级,对传输、存储和计算的带宽要求大。因此我们说数据高效共享是第二大难题。
(3)数据安全
平安城市、智慧城市的建设促使安防云存储技术的应用,智慧城市一大要求就是将视频存储数据相互之间进行联动、共享,例如在犯罪追踪时,公安、交通、民用行业等多范围的存储数据能够共享,而这种共享具备了云存储的特性;传统的存储技术无法满足社会发展需求,云存储的在安防领域的应用成为必然。
安防视频监控数据具有私密性高、保密性强的特点,不仅是事后追查的依据、而且更是后续数据分析挖掘的基础。因此我们说数据安全一方面是指不受到外界数据的入侵和非法获取、另一方面是指庞大系统的鲁棒性、体系容错机制,确保硬件软件发生故障时,数据仍然可以恢复、得以保存。面对海量数据的存储、共享,硬件和软件设备承载了极大的风险,因此我们如何构建大型、海量视频监控存储系统、数据分析系统以及容错冗余机制是第三大难题。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据库日常操作中,INSERT INTO SELECT是实现 “批量数据迁移” 的核心 SQL 语句 —— 它能直接将一个表(或查询结果集)的数 ...
2025-10-16在机器学习建模中,“参数” 是决定模型效果的关键变量 —— 无论是线性回归的系数、随机森林的树深度,还是神经网络的权重,这 ...
2025-10-16在数字化浪潮中,“数据” 已从 “辅助决策的工具” 升级为 “驱动业务的核心资产”—— 电商平台靠用户行为数据优化推荐算法, ...
2025-10-16在大模型从实验室走向生产环境的过程中,“稳定性” 是决定其能否实用的关键 —— 一个在单轮测试中表现优异的模型,若在高并发 ...
2025-10-15在机器学习入门领域,“鸢尾花数据集(Iris Dataset)” 是理解 “特征值” 与 “目标值” 的最佳案例 —— 它结构清晰、维度适 ...
2025-10-15在数据驱动的业务场景中,零散的指标(如 “GMV”“复购率”)就像 “散落的零件”,无法支撑系统性决策;而科学的指标体系,则 ...
2025-10-15在神经网络模型设计中,“隐藏层层数” 是决定模型能力与效率的核心参数之一 —— 层数过少,模型可能 “欠拟合”(无法捕捉数据 ...
2025-10-14在数字化浪潮中,数据分析师已成为企业 “从数据中挖掘价值” 的核心角色 —— 他们既要能从海量数据中提取有效信息,又要能将分 ...
2025-10-14在企业数据驱动的实践中,“指标混乱” 是最常见的痛点:运营部门说 “复购率 15%”,产品部门说 “复购率 8%”,实则是两者对 ...
2025-10-14在手游行业,“次日留存率” 是衡量一款游戏生死的 “第一道关卡”—— 它不仅反映了玩家对游戏的初始接受度,更直接决定了后续 ...
2025-10-13分库分表,为何而生? 在信息技术发展的早期阶段,数据量相对较小,业务逻辑也较为简单,单库单表的数据库架构就能够满足大多数 ...
2025-10-13在企业数字化转型过程中,“数据孤岛” 是普遍面临的痛点:用户数据散落在 APP 日志、注册系统、客服记录中,订单数据分散在交易 ...
2025-10-13在数字化时代,用户的每一次行为 —— 从电商平台的 “浏览→加购→购买”,到视频 APP 的 “打开→搜索→观看→收藏”,再到银 ...
2025-10-11在机器学习建模流程中,“特征重要性分析” 是连接 “数据” 与 “业务” 的关键桥梁 —— 它不仅能帮我们筛选冗余特征、提升模 ...
2025-10-11在企业的数据体系中,未经分类的数据如同 “杂乱无章的仓库”—— 用户行为日志、订单记录、商品信息混杂存储,CDA(Certified D ...
2025-10-11在 SQL Server 数据库操作中,“数据类型转换” 是高频需求 —— 无论是将字符串格式的日期转为datetime用于筛选,还是将数值转 ...
2025-10-10在科研攻关、工业优化、产品开发中,正交试验(Orthogonal Experiment)因 “用少量试验覆盖多因素多水平组合” 的高效性,成为 ...
2025-10-10在企业数据量从 “GB 级” 迈向 “PB 级” 的过程中,“数据混乱” 的痛点逐渐从 “隐性问题” 变为 “显性瓶颈”:各部门数据口 ...
2025-10-10在深度学习中,“模型如何从错误中学习” 是最关键的问题 —— 而损失函数与反向传播正是回答这一问题的核心技术:损失函数负责 ...
2025-10-09本文将从 “检验本质” 切入,拆解两种方法的核心适用条件、场景边界与实战选择逻辑,结合医学、工业、教育领域的案例,让你明确 ...
2025-10-09