京公网安备 11010802034615号
经营许可证编号:京B2-20210330
物联网驱动下的大数据管理
物联网的价值在于其数据,而物联网带来的史无前例的数据规模将驱动现在的数据服务企业发生根本性改变,这要求企业调整其大数据战略。
具有“大数据时代预言家”之称的维克托·迈尔曾经在自己的著名论著《大数据时代》中预言——物联网(IOT)技术的发展将极大地改变传统数据存储分析领域。这就难怪有那么多的公司正试图投身物联网大潮。据麦肯锡全球研究院的最新报告显示:到2025年,物联网行业的总营收将达6.2万亿美元。
但正如维克托担心的一样——这些弄潮儿们真的为物联网将造就的大数据时代做好准备了吗?
当然,除了技术层面的考虑,安全问题也不容忽视。但是,笔者更关心的是:全球大多数的数据中心(包括那些专门非盈利性的数据存储和分析机构)对由物联网即将带来的海量数据似乎毫无准备。
当然有一些科技公司仍然坚持认为自己完全有能力管理好自己的数据中心,但是当数据量以PB或者EB为单位增加时,不知道这些公司是否还认为笔者庸人自扰?如果依旧固执己见,那么他们就不得不对相应的基础设施进行大笔的投资。而相对聪明的公司会选择业界领先的云存储公司作为自己的战略同盟。所以,由物联网引起的大数据潮流将会助推云存储和云计算的发展。
物联网产生的大数据处理过程可以归结为三个基本步骤:数据采集、数据存储和数据分析。数据采集和存储是基本的功能,而大数据时代真正的价值蕴含在数据分析中。对于大数据时代的到来,有专家曾经估计有半数以上的大数据公司可能夭折,而原因是他们未能掌握数据采集相关技术。当然也并不是说过了数据采集这个难关就可以万事大吉,接下来在数据存储方面仍有一连串的挑战。比如,公司必须掌握如分布式计算、并行计算等先进的存储计算方法。
2009年,甲型H1N1流感病毒肆虐全球。与流感病毒传播速度相比,美国政府对流感病例的申告制度显得效率低下。这时候人们才重新注意流感病毒爆发前几周,谷歌公司几位工程师在《Nature》上发表的一篇文章。在文章中,谷歌公司通过对全美境内5000万条最频繁检索的词条和美国疾控心公布的季节性流感传播数据进行比较发现:在未来一段时间很可能爆发一次大规模的流感疫情,而且清楚预测出了具体的地区和州。最后疫情爆发的时候,疾控中心惊讶地发现谷歌公司的预测竟然与疫情爆发地精准吻合。所以,对于大数据时代而言真正的意义在于数据分析。
数据分析的挑战还在于将新的物联网数据和已有的数据库整合。iDoNews认为,有两个方面最令人头疼。首先,软件方面——原来的数据库与物联网数据库之间使用的存储方法不同,这时候就要求公司不得不靠大量的人工重新定义原来的海量数据。第二,硬件方面——两种数据库之间所使用硬件介质(服务器、磁盘等存储介质和网络等基础设施)不同,这将导致公司需要进行更大规模的基础设施建设。
这时候如果还有公司想靠自己一方的努力管理本公司数据,那无疑是作死。
为此,真正有眼光的企业可以采用如下三种方案:
第一种,也是最流行的方式——利用成熟的第三方数据库服务(DBaaS),如亚马逊的Redshift.这种模式的优势在于,客户公司不需要具备安装、管理和运行任何大型数据库的经验和技术。
第二种,利用大数据托管服务。托管服务供应商(MSP)将负责数据收集、数据库管理并提供进行分析和提取数据集的服务。这种模式不仅使企业专注于其商业价值所在的数据分析而将一些较难处理的事情外包,而且还使企业用户无需大量先期投入就可以快速进入大数据应用的市场化阶段,同时也解决了很多企业在该领域的技术短缺。
第三种,基于云计算的数据库矩阵解决方案。这种模式主要针对那些具有多种不同类型、甚至非联系型数据库的公司。这些公司通常要求数据存放于多个数据中心,并且既存于公共端也可能存在私有的云端。公司不仅要求不同类型数据库的解决方案,而且对自身的大数据也有不同的应用需求。美国主机服务商ServePath下的GoGrid云计算平台正致力于这种数据库管理服务。
物联网的价值在于其数据,而物联网带来的史无前例的数据规模将驱动现在的数据服务企业发生根本性改变,这要求企业调整其大数据战略。等着瞧吧,物联网必然催生出大数据管理领域的大赢家。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数字化时代,每一位用户与产品的交互都会留下可追溯的行为轨迹——电商用户的浏览、加购、下单,APP用户的注册、登录、功能使 ...
2026-03-31在日常数据统计、市场调研、学术分析等场景中,我们常常需要判断两个分类变量之间是否存在关联(如性别与消费偏好、产品类型与满 ...
2026-03-31在CDA(Certified Data Analyst)数据分析师的职场实战与认证考核中,“可解释性建模”是核心需求之一——企业决策中,不仅需要 ...
2026-03-31多层感知机(MLP,Multilayer Perceptron)作为深度学习中最基础、最经典的神经网络模型,其结构设计直接决定了模型的拟合能力、 ...
2026-03-30在TensorFlow深度学习实战中,数据集的加载与预处理是基础且关键的第一步。手动下载、解压、解析数据集不仅耗时费力,还容易出现 ...
2026-03-30在CDA(Certified Data Analyst)数据分析师的日常工作中,“无监督分组、挖掘数据内在聚类规律”是高频核心需求——电商场景中 ...
2026-03-30机器学习的本质,是让模型通过对数据的学习,自主挖掘规律、实现预测与决策,而这一过程的核心驱动力,并非单一参数的独立作用, ...
2026-03-27在SQL Server数据库操作中,日期时间处理是高频核心需求——无论是报表统计中的日期格式化、数据筛选时的日期类型匹配,还是业务 ...
2026-03-27在CDA(Certified Data Analyst)数据分析师的能力体系与职场实操中,高维数据处理是高频且核心的痛点——随着业务场景的复杂化 ...
2026-03-27在机器学习建模与数据分析实战中,特征维度爆炸、冗余信息干扰、模型泛化能力差是高频痛点。面对用户画像、企业经营、医疗检测、 ...
2026-03-26在这个数据无处不在的时代,数据分析能力已不再是数据从业者的专属技能,而是成为了职场人、管理者、创业者乃至个人发展的核心竞 ...
2026-03-26在CDA(Certified Data Analyst)数据分析师的能力体系中,线性回归是连接描述性统计与预测性分析的关键桥梁,也是CDA二级认证的 ...
2026-03-26在数据分析、市场研究、用户画像构建、学术研究等场景中,我们常常会遇到多维度、多指标的数据难题:比如调研用户消费行为时,收 ...
2026-03-25在流量红利见顶、获客成本持续攀升的当下,营销正从“广撒网”的经验主义,转向“精耕细作”的数据驱动主义。数据不再是营销的辅 ...
2026-03-25在CDA(Certified Data Analyst)数据分析师的全流程工作中,无论是前期的数据探索、影响因素排查,还是中期的特征筛选、模型搭 ...
2026-03-25在当下数据驱动决策的职场环境中,A/B测试早已成为互联网产品、运营、营销乃至产品迭代优化的核心手段,小到一个按钮的颜色、文 ...
2026-03-24在统计学数据分析中,尤其是分类数据的分析场景里,卡方检验和显著性检验是两个高频出现的概念,很多初学者甚至有一定统计基础的 ...
2026-03-24在CDA(Certified Data Analyst)数据分析师的日常业务分析与统计建模工作中,多组数据差异对比是高频且核心的分析场景。比如验 ...
2026-03-24日常用Excel做数据管理、台账维护、报表整理时,添加备注列是高频操作——用来标注异常、说明业务背景、记录处理进度、补充关键 ...
2026-03-23作为业内主流的自助式数据可视化工具,Tableau凭借拖拽式操作、强大的数据联动能力、灵活的仪表板搭建,成为数据分析师、业务人 ...
2026-03-23