
解读工业大数据的来源、实施项目的关键问题
近年来,随着德国工业4.0和美国工业互联网为代表的新工业革命深入发展,以及“中国制造2025”、“互联网+”行动计划与“促进大数据发展行动纲要”的颁布实施,工业大数据得到了越来越多的关注。这里分享一下我们的思考与实践。
1、工业大数据三大来源
企业信息系统、装备物联网和企业外部互联网是工业大数据的三大来源:
企业信息系统存储了高价值密度的核心业务数据。上世纪60年代以来信息技术加速应用于工业领域,形成了产品生命周期管理(PLM)、企业资源规划(ERP)、供应链管理(SCM)和客户关系管理(CRM)等企业信息系统。这些系统中积累的产品研发数据、生产制造数据、物流供应数据以及客户服务数据,存在于企业或产业链内部,是工业领域传统数据资产。
近年来物联网技术快速发展,装备物联网成为工业大数据新的、增长最快的来源,它实时自动采集了生产设备和交付产品的状态与工况数据。一方面,机床等生产设备物联网数据为智能工厂生产调度、质量控制和绩效管理提供了实时数据基础;另一方面,2012年美国通用电气公司提出的工业大数据(狭义的),专指装备使用过程中由传感器采集的大规模时间序列数据,包括装备状态参数、工况负载和作业环境等信息,可以帮助用户提高装备运行效率,拓展制造服务。
当前互联网与工业深度融合,企业外部互联网已成为工业大数据不可忽视的来源。本世纪初,日本企业就开始利用互联网数据分析获取用户的产品评价,时至今日,小米手机利用社交媒体数据成功实现产品创新研发。此外,外部互联网还存在着海量的“跨界”数据,比如影响装备作业的气象数据、影响产品市场预测的宏观经济数据、影响企业生产成本的环境法规数据……
2、工业大数据实施的关键问题
数据质量、多源关联和系统集成是工业大数据实施的关键问题:
拥有大数据不是目的,发掘其价值才是关键。由企业信息化数据、装备物联网数据和外部互联网数据汇聚而成的工业大数据,蕴藏着巨大价值。例如,通过分析用户使用数据改进产品,通过分析现场测量数据提高工件加工水平,通过工况数据进行产品健康管理等。
笔者认为实施工业大数据项目需要关注以下3个关键问题:
(1)数据质量控制问题
原始数据(生数据)质量决定分析结果的质量。企业信息系统数据质量仍然存在问题,例如2014年某大型机车企业ERP系统中近20%物料存在“一物多码”问题。装备物联网数据质量堪忧,某大型制造企业1个月的状态工况数据中,无效工况(如盾构机传回了工程车工况)、重名工况(同一状态工况使用不同名字)、时标混乱(当前时间错误或时标对不齐)等数据质量问题约30%。
(2)多源数据关联问题
层次化的物料表(Bill Of Material, BOM)定义了企业信息系统数据的核心语义结构。针对跨生命周期的研制BOM和实例BOM间结构失配问题,我们提出了中性BOM模型,并以此为核心,向前关联设计制造BOM,向后关联服务保障BOM,形成星型结构,极大地降低了数据关联的复杂度。同时,针对装备物联网数据和外部互联网数据,可以根据其绑定的物理对象(零部件或产品)与相应的BOM节点相关联。从而以BOM为桥梁,关联3个不同来源的工业大数据。
(3)大数据系统集成问题
工业大数据其来源更加广泛,并且装备物联网数据(半结构化数据)和外部互联网数据(非结构化数据)都要与企业信息系统(结构化数据)进行集成,因此要重构数据支撑平台,甚至替换“旧”系统。
3、工业大数据实施工程案例
工业大数据分析提升工程装备服务保障水平,这里分享两个工程案例:
案例1、工业大数据提供故障分析新手段
液压系统是工程机械的关键部件。2013年我们发现液压系统的油缸密封套腐蚀故障数量异常。于是依据企业信息系统记录的液压系统维修历史数据,通过比对相关状态工况数据(装备物联网数据),搜索推荐与故障车辆关系密切的工况,发现车辆油缸换向频率的波动幅度与这些故障高度相关。
进一步,引入互联网上的行政区划数据和历年工程建设数据(外部互联网数据)后,发现2012~2013年期间这些典型故障均发生在沿海省份,从而推断出盐雾环境是导致密封套腐蚀故障的主要诱因。
案例2、工业大数据提升备件需求预测精度
随着工程装备增量市场增长乏力,以维修保障为主的存量市场成为企业盈利新的增长点。我们利用了企业信息系统中的备件销售订单、采购订单和备件库存状态数据,以及工程物联网采集到的工况数据和外部互联网数据(如每个省的GDP,建筑、交通等规划数据)。
针对30个省市区进行了备件需要预测,平均预测精度为82%,每旬备件需求预测误差在5件或真实值的20%以内。库存水平控制在一个较低的稳定水平,仅为原来库存水平的48%。同时,因为考虑到了20天的配货周期,基于预测的补货策略可以保证现货满足率,消除紧急临时订单。如果按备件库存占有资金1亿元计算,可节约库存资金占用5000万元。
工业大数据是实现智能制造的基础原料,是提升工业生产力、竞争力、创新力的关键要素。然而必须看到,工业大数据是一个正在发展的学科领域,其内涵外延、模型理论、技术方法及其实施策略等还有待发展与创新。唯有结合中国国情认真实践,才能走出中国工业大数据自主之路,实现制造强国的战略目标。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
PyTorch 核心机制:损失函数与反向传播如何驱动模型进化 在深度学习的世界里,模型从 “一无所知” 到 “精准预测” 的蜕变,离 ...
2025-07-252025 年 CDA 数据分析师考纲焕新,引领行业人才新标准 在数字化浪潮奔涌向前的当下,数据已成为驱动各行业发展的核心要素。作为 ...
2025-07-25从数据到决策:CDA 数据分析师如何重塑职场竞争力与行业价值 在数字经济席卷全球的今天,数据已从 “辅助工具” 升级为 “核心资 ...
2025-07-25用 Power BI 制作地图热力图:基于经纬度数据的实践指南 在数据可视化领域,地图热力图凭借直观呈现地理数据分布密度的优势,成 ...
2025-07-24解析 insert into select 是否会锁表:原理、场景与应对策略 在数据库操作中,insert into select 是一种常用的批量数据插入语句 ...
2025-07-24CDA 数据分析师的工作范围解析 在数字化时代的浪潮下,数据已成为企业发展的核心资产之一。CDA(Certified Data Analyst)数据分 ...
2025-07-24从 CDA LEVEL II 考试题型看 Python 数据分析要点 在数据科学领域蓬勃发展的当下,CDA(Certified Data Analyst)认证成为众多从 ...
2025-07-23用 Python 开启数据分析之旅:从基础到实践的完整指南 在数据驱动决策的时代,数据分析已成为各行业不可或缺的核心能力。而 Pyt ...
2025-07-23鸢尾花判别分析:机器学习中的经典实践案例 在机器学习的世界里,有一个经典的数据集如同引路明灯,为无数初学者打开了模式识别 ...
2025-07-23解析 response.text 与 response.content 的核心区别 在网络数据请求与处理的场景中,开发者经常需要从服务器返回的响应中提取数 ...
2025-07-22解析神经网络中 Softmax 函数的核心作用 在神经网络的发展历程中,激活函数扮演着至关重要的角色,它们为网络赋予了非线性能力, ...
2025-07-22CDA数据分析师证书考取全攻略 一、了解 CDA 数据分析师认证 CDA 数据分析师认证是一套科学化、专业化、国际化的人才考核标准, ...
2025-07-22左偏态分布转正态分布:方法、原理与实践 左偏态分布转正态分布:方法、原理与实践 在统计分析、数据建模和科学研究中,正态分 ...
2025-07-22你是不是也经常刷到别人涨粉百万、带货千万,心里痒痒的,想着“我也试试”,结果三个月过去,粉丝不到1000,播放量惨不忍睹? ...
2025-07-21我是陈辉,一个创业十多年的企业主,前半段人生和“文字”紧紧绑在一起。从广告公司文案到品牌策划,再到自己开策划机构,我靠 ...
2025-07-21CDA 数据分析师的职业生涯规划:从入门到卓越的成长之路 在数字经济蓬勃发展的当下,数据已成为企业核心竞争力的重要来源,而 CD ...
2025-07-21MySQL执行计划中rows的计算逻辑:从原理到实践 MySQL 执行计划中 rows 的计算逻辑:从原理到实践 在 MySQL 数据库的查询优化中 ...
2025-07-21在AI渗透率超85%的2025年,企业生存之战就是数据之战,CDA认证已成为决定企业存续的生死线!据麦肯锡全球研究院数据显示,AI驱 ...
2025-07-2035岁焦虑像一把高悬的利刃,裁员潮、晋升无望、技能过时……当职场中年危机与数字化浪潮正面交锋,你是否发现: 简历投了10 ...
2025-07-20CDA 数据分析师报考条件详解与准备指南 在数据驱动决策的时代浪潮下,CDA 数据分析师认证愈发受到瞩目,成为众多有志投身数 ...
2025-07-18