京公网安备 11010802034615号
经营许可证编号:京B2-20210330
在未来,智能数据可以帮助我们了解一个智能系统每时每刻发生了什么,更能够告诉我们为什么会发生。甚至还可以告诉我们接下来会发生什么,以及我们应该如何应对。智能数据将改变企业的商业模式。
大部分专家都相信可以从巨量的数据中找到宝石和金子。英国牛津大学曾对全球各行业工作者做过一份调查问卷,2/3受访者认为,使用数据和分析软件可以使他们保持竞争优势。问题是,这些“金矿挖掘者”今天如何从如此巨大的数据山里挖到金子?
从3V到4V
等着要发掘的“金子”,指的是用于记录、存储和分析大量的数据,以及以合适的形式显示该结果的“大数据”新技术。现在最被人们广泛讨论的话题是用户购物、搜索或网购的数据,或利用全球金融和通信网络而产生的数据。还有银行、电信和保险业通过建立使用者信息与交易记录的分析模型,来增加利润和降低风险等等。大数据的时代,使我们能够探索人类的行为,探索人类本身的奥秘,这在以前在很大程度上是不可能的。我们经常使用的工具和终端,帮助我们获得和体验这方面的感受。
由于都想成为“掘金者”,从大数据挖掘价值,目前具有深入的分析、数学、统计、规划技能的数据分析师正炙手可热,已没有足够多的人才可满足需求。美国大型银行和联邦机构正在越来越多地聘请“首席数据官”(CDO)和数据分析师,以促进对于整个组织机构中的所有功能数据的收集、分析、分发和应用的战略思考。
大数据有所谓的3V特征:即“大量化”(Volume)、“多样化”(Variety)和“快速化”(Velocity)。然而,光是大量的数据采集是不够的,这些数据本身还需要有较高价值,即增加第四个V:Value(价值),成为4V。而经过“大数据”技术的处理(数据采集、数据分析、数据处理、数据显示等)之后更会产生较高的价值。
用智能数据建立智能系统
啤酒+尿布是值得挖掘的数据;而从工业设施、建筑物、能源系统和医院产生的比特和字节,含金量更高,更值得挖掘,因为它们可以用于建立起智能系统,这些比特和字节就是智能数据。我们来谈谈智能数据如何建立起一个智能系统。
终端通过连接、把它们管道化,对人们带来了极大的便利,大大提高了生产率。但是这些还不够,还需要体现“智能化”,实现智能系统。现在我们经常在提到智能手机、智能电表、智能电网、智能家居、智慧城市等等,都是希望人们使用的设备和终端能够根据人们的需要自动编程,实现自动化,尽量避免人工介入。
这样一种“智能化”,需要具备两个条件:首先是“管道化”(互联网思维的核心是“管道化思维”),就是把所有的终端或节点全部连接起来,互相之间能够有“沟通”(即发生交互作用);另一个是各个终端本身具备一个“小电脑”,即带有处理器芯片,可以通过软件处理和产生“智能数据”。有了这两个基本条件,就可以体现出一定程度的智能。
以抽水马桶为例。抽水马桶是已经管道化的马桶,再加上上述第二个条件,就可以变成一个“智能马桶”。具体可以这样来实施:在马桶里装有一片微处理器芯片和一片生化芯片(Lab-on-Chip,LOC),对人们的排泄物自动提取和分析,然后把分析结果通过管道,如WiFi送到医生那里,医生把每天的分析数据与事先存储的数据进行对比,给这位坐过这个马桶的人发出营养指标提醒和生理指标提醒,如果必要的话则写处方,提醒他服用药物或到医院进一步检查。另一方面,根据这个马桶的软件分析结果,会得出缺少哪种营养的具体数据,然后通过无线通信的管道传送到超市,超市会根据这些数据选出合适的食品通过快递服务送达家中。
抽水马桶还可以包含其他各种传感器进行“管道连接”,如每次使用自动记录用水量;如有漏水,自动通知维修人员或物业管理处派人来检修;如有堵塞,就会自动通知管道维修人员来疏通;如水漕不进水,也会自动通知相关人员来处理等等,这些都会产生一定的数据量。
我们必须了解这些智能数据的量,以便正确地评估它;我们必须知道各种器件和设施是如何工作的,了解我们需要哪些传感器和测量技术来获得真正重要的智能数据。决定性的因素不一定是数据量大,而是有价值的内容。
这样的智能数据可以体现在各个领域。如对于一个大型燃气轮机,有几百个传感器每秒钟在测量温度、压力、流量、气体组成。如果人们很了解设施的物理特性,因此知道如何正确地分析这些数据,就可以给发电厂非常有用的建议,来提高电力的使用效率并减少污染。同样的措施可以用于风力发电、建筑物、钢铁厂和整个城市。所有这些领域里,必须不仅收集数据,而且还理解数据。处理的数据是智能数据,得出的结论用于将企业或城市变得更智能。
适合于评估这些智能数据的算法还需要开发。这些算法可以帮助人们更好地节省能源、更好地有利于环境、更多地节省成本,以及使设备运行得更可靠。
在未来,智能数据可以帮助我们了解一个智能系统每时每刻发生了什么,更能够告诉我们为什么会发生。甚至还可以告诉我们接下来会发生什么,以及我们应该如何应对。智能数据将改变企业的商业模式。例如一家跨国公司可以设立一个全球维修中心,全球各个分部的工厂都设有大量传感器并与网络相连,只需要在这个中心分析大量的远程智能数据,就可以进行远程诊断和处理,而不需要技术人员到现场。这样的商业模式,对于火车、船舶、发电厂、医疗器械等等都是极其有用的。例如,从一辆火车的运行中得到的测量数据,可以帮助火车驾驶者运行的更平稳、更节能。节省下来的资金,则可以在用户和智能数据提供者两者分成。这是双赢的局面,也是如何从数据山中掘金的一个很好例子。
大数据如何成为“智能数据”
数据只是“大”,并没有太大意义,关键是如何最佳地挖掘高价值的数据、使用这些数据,使这些数据成为“智能数据”。这有几个方法:先评估数据的价值和将会产生的价值;把数据和“智能化”相关联;把数据变成具有上下文意义的灵活的数据结构;随着时间的推移,根据这些收集了的大量数据,展现一幅绚丽多彩的智能数据图。到最后,也不会再去思考大数据与智能数据有何区别,因为所有的数据都已经成为智能数据。
西方2000多年前就已发明的“管道化”的马桶开了物联网的先河。基于互联网的物联网(IoT)的到来,预示了新的创新设备、新的网络形态、新的商业模式的不断涌现,也预示着智能数据的成千上百倍增长,智能化将体现在各种应用中。如按照今天所理解的大数据概念,是不充分的,大数据必须从3V演变为4V,大数据必须演变成智能数据,整个家庭乃至整个城市也正在向“智能化”大步演进,才会有更多的“掘金”机会。CDA数据分析师培训官网
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在实验检测、质量控制、科研验证等场景中,“方法验证”是确保检测/分析结果可靠、可复用的核心环节——无论是新开发的检测方法 ...
2026-03-04在数据分析、科研实验、办公统计等场景中,我们常常需要对比两组数据的整体差异——比如两种营销策略的销售额差异、两种实验方案 ...
2026-03-04在数字化转型进入深水区的今天,企业对数据的依赖程度日益加深,而数据治理体系则是企业实现数据规范化、高质量化、价值化的核心 ...
2026-03-04在深度学习,尤其是卷积神经网络(CNN)的实操中,转置卷积(Transposed Convolution)是一个高频应用的操作——它核心用于实现 ...
2026-03-03在日常办公、数据分析、金融理财、科研统计等场景中,我们经常需要计算“平均值”来概括一组数据的整体水平——比如计算月度平均 ...
2026-03-03在数字化转型的浪潮中,数据已成为企业最核心的战略资产,而数据治理则是激活这份资产价值的前提——没有规范、高质量的数据治理 ...
2026-03-03在Excel办公中,数据透视表是汇总、分析繁杂数据的核心工具,我们常常通过它快速得到销售额汇总、人员统计、业绩分析等关键结果 ...
2026-03-02在日常办公和数据分析中,我们常常需要探究两个或多个数据之间的关联关系——比如销售额与广告投入是否正相关、员工出勤率与绩效 ...
2026-03-02在数字化运营中,时间序列数据是CDA(Certified Data Analyst)数据分析师最常接触的数据类型之一——每日的营收、每小时的用户 ...
2026-03-02在日常办公中,数据透视表是Excel、WPS等表格工具中最常用的数据分析利器——它能快速汇总繁杂数据、挖掘数据关联、生成直观报表 ...
2026-02-28有限元法(Finite Element Method, FEM)作为工程数值模拟的核心工具,已广泛应用于机械制造、航空航天、土木工程、生物医学等多 ...
2026-02-28在数字化时代,“以用户为中心”已成为企业运营的核心逻辑,而用户画像则是企业读懂用户、精准服务用户的关键载体。CDA(Certifi ...
2026-02-28在Python面向对象编程(OOP)中,类方法是构建模块化、可复用代码的核心载体,也是实现封装、继承、多态特性的关键工具。无论是 ...
2026-02-27在MySQL数据库优化中,索引是提升查询效率的核心手段—— 面对千万级、亿级数据量,合理创建索引能将查询时间从秒级压缩到毫秒级 ...
2026-02-27在数字化时代,企业积累的海量数据如同散落的珍珠,若缺乏有效的梳理与分类,终将难以发挥实际价值。CDA(Certified Data Analys ...
2026-02-27在问卷调研中,我们常遇到这样的场景:针对同一批调查对象,在不同时间点(如干预前、干预后、随访期)发放相同或相似的问卷,收 ...
2026-02-26在销售管理的实操场景中,“销售机会”是核心抓手—— 从潜在客户接触到最终成交,每一个环节都藏着业绩增长的关键,也暗藏着客 ...
2026-02-26在CDA数据分析师的日常工作中,数据提取、整理、加工是所有分析工作的起点,而“创建表”与“创建视图”,则是数据库操作中最基 ...
2026-02-26在机器学习分析、数据决策的全流程中,“数据质量决定分析价值”早已成为行业共识—— 正如我们此前在运用机器学习进行分析时强 ...
2026-02-25在数字化时代,数据已成为企业决策、行业升级的核心资产,但海量杂乱的原始数据本身不具备价值—— 只有通过科学的分析方法,挖 ...
2026-02-25