
工业大数据的3大来源和关键问题
近年来,随着德国工业4.0和美国工业互联网为代表的新工业革命深入发展,以及“中国制造2025”、“互联网+”行动计划与“促进大数据发展行动纲要”的颁布实施,工业大数据得到了越来越多的关注。这里分享一下我们的思考与实践。
工业大数据三大来源
一、企业信息系统、装备物联网和企业外部互联网是工业大数据的三大来源:
企业信息系统存储了高价值密度的核心业务数据。上世纪60年代以来信息技术加速应用于工业领域,形成了产品生命周期管理(PLM)、企业资源规划(ERP)、供应链管理(SCM)和客户关系管理(CRM)等企业信息系统。这些系统中积累的产品研发数据、生产制造数据、物流供应数据以及客户服务数据,存在于企业或产业链内部,是工业领域传统数据资产。
近年来物联网技术快速发展,装备物联网成为工业大数据新的、增长最快的来源,它实时自动采集了生产设备和交付产品的状态与工况数据。一方面,机床等生产设备物联网数据为智能工厂生产调度、质量控制和绩效管理提供了实时数据基础;另一方面,2012年美国通用电气公司提出的工业大数据(狭义的),专指装备使用过程中由传感器采集的大规模时间序列数据,包括装备状态参数、工况负载和作业环境等信息,可以帮助用户提高装备运行效率,拓展制造服务。
当前互联网与工业深度融合,企业外部互联网已成为工业大数据不可忽视的来源。本世纪初,日本企业就开始利用互联网数据分析获取用户的产品评价,时至今日,小米手机利用社交媒体数据成功实现产品创新研发。此外,外部互联网还存在着海量的“跨界”数据,比如影响装备作业的气象数据、影响产品市场预测的宏观经济数据、影响企业生产成本的环境法规数据……
工业大数据实施的关键问题
二、数据质量、多源关联和系统集成是工业大数据实施的关键问题:
拥有大数据不是目的,发掘其价值才是关键。由企业信息化数据、装备物联网数据和外部互联网数据汇聚而成的工业大数据,蕴藏着巨大价值。例如,通过分析用户使用数据改进产品,通过分析现场测量数据提高工件加工水平,通过工况数据进行产品健康管理等。
笔者认为实施工业大数据项目需要关注以下3个关键问题:
1、数据质量控制问题
原始数据(生数据)质量决定分析结果的质量。企业信息系统数据质量仍然存在问题,例如2014年某大型机车企业ERP系统中近20%物料存在“一物多码”问题。装备物联网数据质量堪忧,某大型制造企业1个月的状态工况数据中,无效工况(如盾构机传回了工程车工况)、重名工况(同一状态工况使用不同名字)、时标混乱(当前时间错误或时标对不齐)等数据质量问题约30%。
2、多源数据关联问题
层次化的物料表(Bill Of Material, BOM)定义了企业信息系统数据的核心语义结构。针对跨生命周期的研制BOM和实例BOM间结构失配问题,我们提出了中性BOM模型,并以此为核心,向前关联设计制造BOM,向后关联服务保障BOM,形成星型结构,极大地降低了数据关联的复杂度。同时,针对装备物联网数据和外部互联网数据,可以根据其绑定的物理对象(零部件或产品)与相应的BOM节点相关联。从而以BOM为桥梁,关联3个不同来源的工业大数据。
3、大数据系统集成问题
工业大数据其来源更加广泛,并且装备物联网数据(半结构化数据)和外部互联网数据(非结构化数据)都要与企业信息系统(结构化数据)进行集成,因此要重构数据支撑平台,甚至替换“旧”系统。
工业大数据实施工程案例
三、工业大数据分析提升工程装备服务保障水平,这里分享两个工程案例:
1、工业大数据提供故障分析新手段
液压系统是工程机械的关键部件。2013年我们发现液压系统的油缸密封套腐蚀故障数量异常。于是依据企业信息系统记录的液压系统维修历史数据,通过比对相关状态工况数据(装备物联网数据),搜索推荐与故障车辆关系密切的工况,发现车辆油缸换向频率的波动幅度与这些故障高度相关。
进一步,引入互联网上的行政区划数据和历年工程建设数据(外部互联网数据)后,发现2012~2013年期间这些典型故障均发生在沿海省份,从而推断出盐雾环境是导致密封套腐蚀故障的主要诱因。
2、工业大数据提升备件需求预测精度
随着工程装备增量市场增长乏力,以维修保障为主的存量市场成为企业盈利新的增长点。我们利用了企业信息系统中的备件销售订单、采购订单和备件库存状态数据,以及工程物联网采集到的工况数据和外部互联网数据(如每个省的GDP,建筑、交通等规划数据)。
针对30个省市区进行了备件需要预测,平均预测精度为82%,每旬备件需求预测误差在5件或真实值的20%以内。库存水平控制在一个较低的稳定水平,仅为原来库存水平的48%。同时,因为考虑到了20天的配货周期,基于预测的补货策略可以保证现货满足率,消除紧急临时订单。如果按备件库存占有资金1亿元计算,可节约库存资金占用5000万元。
工业大数据是实现智能制造的基础原料,是提升工业生产力、竞争力、创新力的关键要素。然而必须看到,工业大数据是一个正在发展的学科领域,其内涵外延、模型理论、技术方法及其实施策略等还有待发展与创新。唯有结合中国国情认真实践,才能走出中国工业大数据自主之路,实现制造强国的战略目标。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
DBeaver 实战:实现两个库表结构同步的高效路径 在数据库管理与开发工作中,保持不同环境(如开发库与生产库、主库与从库)的表 ...
2025-08-08t 检验与卡方检验:数据分析中的两大统计利器 在数据分析领域,统计检验是验证假设、挖掘数据规律的重要手段。其中,t 检验和卡 ...
2025-08-08CDA 数据分析师:解锁数据价值的专业力量 在当今这个数据爆炸的时代,数据已成为像石油一样珍贵的战略资源。而 CDA 数据分析师, ...
2025-08-08人工智能对CDA数据分析领域的影响 人工智能对 CDA(Certified Data Analyst,注册数据分析师)数据分析领域的影响是全方位、多层 ...
2025-08-07SPSS 语法使用详解 在当今数据驱动的时代,SPSS( Statistical Package for the Social Sciences)作为一款功能强大的统计分析软 ...
2025-08-07SASEM 决策树:理论与实践应用 在复杂的决策场景中,如何从海量数据中提取有效信息并制定科学决策,是各界关注的焦点。SASEM 决 ...
2025-08-07CDA含金量分析 在数字经济与人工智能深度融合的时代,数据驱动决策已成为企业核心竞争力的关键要素。CDA(Certified Data Analys ...
2025-08-07大数据时代对定性分析的影响 在大数据时代,海量、多样、高速且低价值密度的数据充斥着我们的生活与工作。而定性分析作为一 ...
2025-08-07K-S 曲线、回归与分类:数据分析中的重要工具 在数据分析与机器学习领域,K-S 曲线、回归和分类是三个核心概念与工具,它们各 ...
2025-08-07CDA 数据分析师考试全解析 在当今数字化时代,数据已成为企业发展的核心驱动力,数据分析师这一职业也愈发受到重视。CDA 数据分 ...
2025-08-07大数据时代的隐患:繁荣背后的隐忧 当我们在电商平台浏览商品时,系统总能 “精准” 推送心仪的物品;当我们刷短视频时,算法 ...
2025-08-07解析 F 边界检验:协整分析中的实用工具 在计量经济学的时间序列分析中,判断变量之间是否存在长期稳定的均衡关系(即协整关系) ...
2025-08-07CDA 数据分析师报考条件详解:迈向专业认证的指南 在数据分析行业蓬勃发展的当下,CDA 数据分析师认证成为众多从业者提升专业 ...
2025-08-07通过 COX 回归模型诊断异常值 一、COX 回归模型概述 COX 回归模型,又称比例风险回归模型,是一种用于生存分析的统计方法。它能 ...
2025-08-07评判两组数据与初始数据准确值的方法 在数据分析与研究中,我们常常会面临这样的情况:需要对通过不同方法、不同过程得到的两组 ...
2025-08-07CDA 数据分析师行业标准:构建数据人才的能力坐标系 在数据驱动决策成为企业核心竞争力的时代,CDA(数据分析师)行业标准作为 ...
2025-08-07反向传播神经网络:突破传统算法瓶颈的革命性力量 在人工智能发展的历史长河中,传统算法曾长期主导着数据处理与模式识别领域 ...
2025-08-07MySQL 统计连续每天数据:从业务需求到技术实现 在数据分析场景中,连续日期的数据统计是衡量业务连续性的重要手段 —— 无论是 ...
2025-08-07抖音数据分析师:驱动平台增长的幕后推手 在抖音这个日活用户数以亿计的超级平台上,每一次用户的滑动、点赞、评论,每一条 ...
2025-08-07基于 SPSS 的中介效应分析结果解读:揭示变量间的隐性关联 在社会科学与自然科学研究中,变量之间的关系往往并非简单的直接作用 ...
2025-08-07