京公网安备 11010802034615号
经营许可证编号:京B2-20210330
物联网大数据被激发的三个特征
虽然数据本身是客观存在的,但是它的范畴是随着文明的进程不断变化和扩大的。在万物互联时代,大数据的几个重要特征将会被成倍放大,并最终形成特殊的应用场景及商业模式。
数据的体量将会成倍增加
正如移动互联网时代,核心网络节点从PC转换为人一样,在万物互联时代,无数的物理硬件将成为核心网络节点,数据来自无数自动化传感器、自动记录设施、生产监测、环境监测、交通监测、安防监测等;来自自动流程记录,刷卡机、收款机、电子不停车收费系统,互联网点击、电话拨号等设施以及各种办事流程登记等。由于连接数的增加,不间断的数据收集、存储、回传,以及更高清的图片和视频应用,都会让数据的体量有惊人的爆发。
比如Google街景服务,每辆车每天产生的数据将达到1TB,加入分三个拷贝,一年就是1PB,而目前最大容量的存储硬盘不过是10TB。
在万物互联的场景下,每天都会有大量的终端在进行类似Google街景这样的数据回传,而大数据的理念,要求数据尽可能庞大且非刻意收集。
伴随着物联网技术的成熟,产业的爆发,各种随身设备、物联网和云计算、云存储等技术的发展,万物都将被联网,物的所有轨迹都可以被记录,一切皆被数字化,因此产生的数据可以想象,比之今天,会有多大量级的增加。数据存储、数据计算与挖掘技术,都将成为万物互联场景下大数据应用的核心能力。
数据的及时性特征将会被放大
在互联网甚至是移动互联网时代,数据的及时性并没有那么重要,大量的统计结果是基于过往数据的挖掘而产生的,这些不及时的数据意义也是非常巨大的。Google利用不同地区人们的搜索习惯,成功预测了流行疾病的爆发。Facebook利用网民在无压力情况下浏览网页、评论、点赞、社交言论的情况,成功预测了美国各州总统大选的结果。这些都属于利用过往大数据的成功应用案例。
但是在万物互联场景下,由于物联网可以实现微量数据的不间断回传,人们对于数据的及时性需求将越来越旺盛,无等待服务将被更多的行业提供,从而产生更多的应用场景。
比如在智慧交通上,百度、高德等地图厂商,已经可以通过智能手机的数据回传,动态监控整个城市的交通情况,从而为用户提供实时的路况信息。目前这种路况信息已经取代了传统的交通广播模式,能够实现个性化地关注出行路线的路况,并根据交通情况,自动设计、自动更改。
目前,在物联网应用领域,缺乏一个类似iPhone之于移动互联网一般里程碑的产品。而大多数人都将此寄希望于无人驾驶,因为人类如果能将汽车这样一个工业时代最重要的个人产品进行智能化、数字化,那么将极大带动其他产业物联网化发展。而无人驾驶的前提,除了提前将整个街区数字化以外,不间断的数据回传也非常重要。在物联网环境下,随着车与更多物品连接起来,将会形成更大范围的网络效应,交通这个生态也将进一步丰富起来。
而在车联网普及方面,也许到来的速度要比我们想象的还要快一些。欧盟已经提出打造数字化大市场,首先在车联网领域进行突破,2018年3月31日开始,所有的汽车必须配备ecall装置,每个ecall设备中需要放入SIM卡。欧洲运营商Vodafone,自建并运营了全球第三大M2M平台(GDSP),确保M2M SIM 卡在全球无缝漫游,保证持续使用。截至2016年第一季度,Vodafone M2M连接数超过2000万,收入增速达到21%。到2019年,M2M计划新增覆盖50个国家,覆盖全球90%以上区域。
数据的完备性将得到极大提升
在大数据时代,数据格式变得越来越多样,涵盖了文本、音频、图片、视频、模拟信号等不同的类型;数据来源也越来越多样,不仅产生于组织内部运作的各个环节,也来自于组织外部。
例如,在交通领域,北京市交通智能化分析平台的数据来自路网摄像头/传感器、公交、轨道交通、出租车以及省际客运、旅游、化危运输、停车、租车等运输行业,还有问卷调查和地理信息系统数据。
4万辆浮动车每天产生2000万条记录,交通卡刷卡记录每天1900万条,手机定位数据每天1800万条,出租车运营数据每天100万条,电子停车收费系统数据每天50万条,定期调查覆盖8万户家庭等,这些数据在体量和速度上都达到了大数据的规模。
数据的完备性,尤其是跨界数据的交叉运用,将会产生意想不到的应用场景。亚马逊正是此中高手,更加完备的数据,让亚马逊在个性化推荐的时候,并不用如沃尔玛一样思考为什么买啤酒的用户会买尿不湿,他们只是通过统计学发现数以百计的类似关联现象,配合更多诸如年龄、消费习惯、性别等标签数据,将结论直接用于精细化营销。
总 结
物联网大数据的故事还有很长很长,数据的爆发只是一个开始,我们如何收集海量的数据,如何储存,如何设定算法,如何运用机器智能实现自动运算,如何将运算的结果用于预测未来或者更多的商业场景,最后如何确保我们的数据安全。
这里的每一个步骤,都是一个细分领域,我们在大数据应用的路上才刚刚起步。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在 MySQL 数据查询中,“按顺序计数” 是高频需求 —— 例如 “统计近 7 天每日订单量”“按用户 ID 顺序展示消费记录”“按产品 ...
2025-10-31在数据分析中,“累计百分比” 是衡量 “部分与整体关系” 的核心指标 —— 它通过 “逐步累加的占比”,直观呈现数据的分布特征 ...
2025-10-31在 CDA(Certified Data Analyst)数据分析师的工作中,“二分类预测” 是高频需求 —— 例如 “预测用户是否会流失”“判断客户 ...
2025-10-31在 MySQL 实际应用中,“频繁写入同一表” 是常见场景 —— 如实时日志存储(用户操作日志、系统运行日志)、高频交易记录(支付 ...
2025-10-30为帮助教育工作者、研究者科学分析 “班级规模” 与 “平均成绩” 的关联关系,我将从相关系数的核心定义与类型切入,详解 “数 ...
2025-10-30对 CDA(Certified Data Analyst)数据分析师而言,“相关系数” 不是简单的数字计算,而是 “从业务问题出发,量化变量间关联强 ...
2025-10-30在构建前向神经网络(Feedforward Neural Network,简称 FNN)时,“隐藏层数目设多少?每个隐藏层该放多少个神经元?” 是每个 ...
2025-10-29这个问题切中了 Excel 用户的常见困惑 —— 将 “数据可视化工具” 与 “数据挖掘算法” 的功能边界混淆。核心结论是:Excel 透 ...
2025-10-29在 CDA(Certified Data Analyst)数据分析师的工作中,“多组数据差异验证” 是高频需求 —— 例如 “3 家门店的销售额是否有显 ...
2025-10-29在数据分析中,“正态分布” 是许多统计方法(如 t 检验、方差分析、线性回归)的核心假设 —— 数据符合正态分布时,统计检验的 ...
2025-10-28箱线图(Box Plot)作为展示数据分布的核心统计图表,能直观呈现数据的中位数、四分位数、离散程度与异常值,是质量控制、实验分 ...
2025-10-28在 CDA(Certified Data Analyst)数据分析师的工作中,“分类变量关联分析” 是高频需求 —— 例如 “用户性别是否影响支付方式 ...
2025-10-28在数据可视化领域,单一图表往往难以承载多维度信息 —— 力导向图擅长展现节点间的关联结构与空间分布,却无法直观呈现 “流量 ...
2025-10-27这个问题问到了 Tableau 中两个核心行级函数的经典组合,理解它能帮你快速实现 “相对位置占比” 的分析需求。“index ()/size ( ...
2025-10-27对 CDA(Certified Data Analyst)数据分析师而言,“假设检验” 绝非 “套用统计公式的机械操作”,而是 “将模糊的业务猜想转 ...
2025-10-27在数字化运营中,“凭感觉做决策” 早已成为过去式 —— 运营指标作为业务增长的 “晴雨表” 与 “导航仪”,直接决定了运营动作 ...
2025-10-24在卷积神经网络(CNN)的训练中,“卷积层(Conv)后是否添加归一化(如 BN、LN)和激活函数(如 ReLU、GELU)” 是每个开发者都 ...
2025-10-24在数据决策链条中,“统计分析” 是挖掘数据规律的核心,“可视化” 是呈现规律的桥梁 ——CDA(Certified Data Analyst)数据分 ...
2025-10-24在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23