京公网安备 11010802034615号
经营许可证编号:京B2-20210330
“大数据”到“智能数据”的迈进
大部分专家都相信可以从巨量的数据中找到宝石和金子。英国的牛津大学也曾对全球各行业工作者做过一份调查问卷,2/3受访者表示使用数据和分析软件可以使他们保持竞争优势。
但问题也随之而来,今天,我们如何从如此巨大的数据山里挖到金子?
这些被人们高度重视的“金子”,指的是用于记录、存储和分析大量的数据,以及以合适的形式显示该结果的“大数据”新技术。现在最被人们广泛讨论的,是用户购物、搜索或网购的数据,或利用全球金融和通信网络而产生的数据,还有银行、电信和保险业通过建立使用者信息与交易记录的分析模型,来增加利润和降低风险等等。
大数据的时代,使我们能够探索人类的行为,探索人类本身的奥秘,这在以前在很大程度上是不可能的。我们经常使用的工具和终端,帮助我们获得和体验这方面的感受。
由于都想从大数据中挖掘价值,所以目前具有深入的分析、数学、统计、规划技能的数据分析师正炙手可热,已没有足够多的人才可满足需求。美国大型银行和联邦机构正在越来越多地聘请“首席数据官”(CDO)和数据分析师,以促进对于整个组织机构中的所有功能数据的收集、分析、分发和应用的战略思考。
大数据有所谓的3V特征:即“大量化”(Volume)、“多样化”(Variety)和“快速化”(Velocity)。然而,光是大量的数据采集是不够的,这些数据本身还需要有较高价值,即增加第四个V:Value(价值),成为4V。而经过“大数据”技术的处理之后更会产生较高的价值。
“啤酒 尿布”是值得挖掘的数据;而从工业设施、建筑物、能源系统和医院产生的比特和字节,含金量更高,更值得挖掘,因为它们可以用于建立起智能系统,这些比特和字节就是智能数据。那么,智能数据如何建立起一个智能系统呢?
终端通过连接、把它们管道化,对人们带来了极大的便利,大大提高了生产率。但是这些还不够,还需要体现“智能化”。现在我们经常提到智能手机、智能家居、智慧城市等等,都是希望人们使用的设备和终端能够根据人们的需要自动编程,实现自动化,尽量避免人工介入。
这样一种“智能化”,需要具备两个条件:首先是“管道化”(互联网思维的核心是“管道化思维”),把所有的终端或节点全部连接起来,互相之间能够有“沟通”(即发生交互作用);另一个是各个终端本身具备一个“小电脑”,即带有处理器芯片,可以通过软件处理和产生“智能数据”。有了这两个基本条件,就可以体现出一定程度的智能。
【以抽水马桶为例】
抽水马桶是已经管道化的马桶,再加上上述第二个条件,就可以变成一个“智能马桶”。具体可以这样来实施:在马桶里装有一片微处理器芯片和一片生化芯片,对人们的排泄物自动提取和分析,然后把分析结果通过管道,如WiFi送到医生那里,医生把每天的分析数据与事先存储的数据进行对比,给这位坐过这个马桶的人发出营养指标提醒和生理指标提醒,如果必要的话则写处方,提醒他服用药物或到医院进一步检查。另一方面,根据这个马桶的软件分析结果,会得出缺少哪种营养的具体数据,然后通过无线通信的管道传送到超市,超市会根据这些数据选出合适的食品通过快递服务送达家中。
日本卫浴品牌TOTO的工程师们开发了一款马桶,马桶可插入记忆卡,便盆内加装了收集尿液的装置可测糖分和温度。另外马桶周边的利用,在进厕所解放前,总要先脱裤子,利用这个空档,地上的地磅已经记录了你的体重,就坐后简单的套上臂带,臂带上的仪器就会开始记录血压,当然这也会记录下你前后的血压变化,完毕后穿裤子又会在记录一次体重。
TOTO的这款马桶,目前虽然只能验尿糖,但假以时日检测会更进步,周边科技也再眼花,马桶的检验功能也会跟着增加。也许,这些数据就能连接到网络上,进行网上诊断,一旦出现异常就会自动通报医生,如果不是什么重症,药自动送到家门,这对老年人来说无疑不是一大利器。
马桶还可以包含其他各种传感器进行“管道连接”,如每次使用自动记录用水量,如有漏水,自动通知维修人员或物业管理处派人来检修。诸多问题,都会自动通知相关人员来处理,这些都会产生一定的数据量。
我们必须了解这些智能数据的量以便正确地评估;也必须知道各种器件和设施是如何工作的,了解我们需要哪些传感器和测量技术来获得真正重要的智能数据。决定性的因素不一定是数据量大,而是有价值的内容。
这样的智能数据可以体现在各个领域。如对于一个大型燃气轮机,有几百个传感器每秒钟在测量温度、压力、流量、气体组成。如果人们很了解设施的物理特性,因此知道如何正确地分析这些数据,就可以给发电厂非常有用的建议,来提高电力的使用效率并减少污染。所有这些领域里,必须不仅收集数据,而且还理解数据。处理的数据是智能数据,得出的结论用于将企业或城市变得更智能。
适合于评估这些智能数据的算法还需要开发。这些算法可以帮助人们更好地节省能源、更好地有利于环境、更多地节省成本,以及使设备运行得更可靠。
在未来,智能数据可以帮助我们了解一个智能系统每时每刻发生了什么,甚至还可以预测接下来会发生什么,以及我们应该如何应对。
智能数据将改变企业的商业模式。例如一家跨国公司可以设立一个全球维修中心,全球各个分部的工厂都设有大量传感器并与网络相连,只需要在这个中心分析大量的远程智能数据,就可以进行远程诊断和处理,而不需要技术人员到现场。这样的商业模式,对于火车、船舶、发电厂、医疗器械等等都是极其有用的。
数据只是“大”,并没有太大意义,关键是如何最佳地挖掘高价值的数据、使用这些数据,使这些数据成为“智能数据”。
向智能数据迈进的几个方法:
1.评估数据的价值和将会产生的价值
2.把数据和“智能化”相关联
3.把数据变成具有上下文意义的灵活的数据结构
4.随着时间的推移,根据这些收集了的大量数据,展现一幅绚丽多彩的智能数据图。
西方2000多年前就已发明的“管道化”的马桶开了物联网的先河。基于互联网的物联网(IoT)的到来,预示了新的创新设备、新的网络形态、新的商业模式的不断涌现,也预示着智能数据的成千上百倍增长,智能化将体现在各种应用中。
如按照今天所理解的大数据概念,是不充分的。大数据必须从3V演变为4V,必须演变成智能数据,整个家庭乃至整个城市也正在向“智能化”大步演进,才会有更多的“掘金”机会。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在统计调查与数据分析中,抽样方法分为简单随机抽样与复杂抽样两大类。简单随机抽样因样本均匀、计算简便,是基础的抽样方式,但 ...
2026-02-02在数据驱动企业发展的今天,“数据分析”已成为企业经营决策的核心支撑,但实践中,战略数据分析与业务数据分析两个概念常被混淆 ...
2026-02-02在数据驱动企业发展的今天,“数据分析”已成为企业经营决策的核心支撑,但实践中,战略数据分析与业务数据分析两个概念常被混淆 ...
2026-02-02B+树作为数据库索引的核心数据结构,其高效的查询、插入、删除性能,离不开节点间指针的合理设计。在日常学习和数据库开发中,很 ...
2026-01-30在数据库开发中,UUID(通用唯一识别码)是生成唯一主键、唯一标识的常用方式,其标准格式包含4个短横线(如550e8400-e29b-41d4- ...
2026-01-30商业数据分析的价值落地,离不开标准化、系统化的总体流程作为支撑;而CDA(Certified Data Analyst)数据分析师,作为经过系统 ...
2026-01-30在数据分析、质量控制、科研实验等场景中,数据波动性(离散程度)的精准衡量是判断数据可靠性、稳定性的核心环节。标准差(Stan ...
2026-01-29在数据分析、质量检测、科研实验等领域,判断数据间是否存在本质差异是核心需求,而t检验、F检验是实现这一目标的经典统计方法。 ...
2026-01-29统计制图(数据可视化)是数据分析的核心呈现载体,它将抽象的数据转化为直观的图表、图形,让数据规律、业务差异与潜在问题一目 ...
2026-01-29箱线图(Box Plot)作为数据分布可视化的核心工具,能清晰呈现数据的中位数、四分位数、异常值等关键统计特征,广泛应用于数据分 ...
2026-01-28在回归分析、机器学习建模等数据分析场景中,多重共线性是高频数据问题——当多个自变量间存在较强的线性关联时,会导致模型系数 ...
2026-01-28数据分析的价值落地,离不开科学方法的支撑。六种核心分析方法——描述性分析、诊断性分析、预测性分析、规范性分析、对比分析、 ...
2026-01-28在机器学习与数据分析领域,特征是连接数据与模型的核心载体,而特征重要性分析则是挖掘数据价值、优化模型性能、赋能业务决策的 ...
2026-01-27关联分析是数据挖掘领域中挖掘数据间潜在关联关系的经典方法,广泛应用于零售购物篮分析、电商推荐、用户行为路径挖掘等场景。而 ...
2026-01-27数据分析的基础范式,是支撑数据工作从“零散操作”走向“标准化落地”的核心方法论框架,它定义了数据分析的核心逻辑、流程与目 ...
2026-01-27在数据分析、后端开发、业务运维等工作中,SQL语句是操作数据库的核心工具。面对复杂的表结构、多表关联逻辑及灵活的查询需求, ...
2026-01-26支持向量机(SVM)作为机器学习中经典的分类算法,凭借其在小样本、高维数据场景下的优异泛化能力,被广泛应用于图像识别、文本 ...
2026-01-26在数字化浪潮下,数据分析已成为企业决策的核心支撑,而CDA数据分析师作为标准化、专业化的数据人才代表,正逐步成为连接数据资 ...
2026-01-26数据分析的核心价值在于用数据驱动决策,而指标作为数据的“载体”,其选取的合理性直接决定分析结果的有效性。选对指标能精准定 ...
2026-01-23在MySQL查询编写中,我们习惯按“SELECT → FROM → WHERE → ORDER BY”的语法顺序组织语句,直觉上认为代码顺序即执行顺序。但 ...
2026-01-23