京公网安备 11010802034615号
经营许可证编号:京B2-20210330
解读工业大数据的来源、实施项目的关键问题
近年来,随着德国工业4.0和美国工业互联网为代表的新工业革命深入发展,以及“中国制造2025”、“互联网+”行动计划与“促进大数据发展行动纲要”的颁布实施,工业大数据得到了越来越多的关注。这里分享一下我们的思考与实践。
1、工业大数据三大来源
企业信息系统、装备物联网和企业外部互联网是工业大数据的三大来源:
企业信息系统存储了高价值密度的核心业务数据。上世纪60年代以来信息技术加速应用于工业领域,形成了产品生命周期管理(PLM)、企业资源规划(ERP)、供应链管理(SCM)和客户关系管理(CRM)等企业信息系统。这些系统中积累的产品研发数据、生产制造数据、物流供应数据以及客户服务数据,存在于企业或产业链内部,是工业领域传统数据资产。
近年来物联网技术快速发展,装备物联网成为工业大数据新的、增长最快的来源,它实时自动采集了生产设备和交付产品的状态与工况数据。一方面,机床等生产设备物联网数据为智能工厂生产调度、质量控制和绩效管理提供了实时数据基础;另一方面,2012年美国通用电气公司提出的工业大数据(狭义的),专指装备使用过程中由传感器采集的大规模时间序列数据,包括装备状态参数、工况负载和作业环境等信息,可以帮助用户提高装备运行效率,拓展制造服务。
当前互联网与工业深度融合,企业外部互联网已成为工业大数据不可忽视的来源。本世纪初,日本企业就开始利用互联网数据分析获取用户的产品评价,时至今日,小米手机利用社交媒体数据成功实现产品创新研发。此外,外部互联网还存在着海量的“跨界”数据,比如影响装备作业的气象数据、影响产品市场预测的宏观经济数据、影响企业生产成本的环境法规数据……
2、工业大数据实施的关键问题
数据质量、多源关联和系统集成是工业大数据实施的关键问题:
拥有大数据不是目的,发掘其价值才是关键。由企业信息化数据、装备物联网数据和外部互联网数据汇聚而成的工业大数据,蕴藏着巨大价值。例如,通过分析用户使用数据改进产品,通过分析现场测量数据提高工件加工水平,通过工况数据进行产品健康管理等。
笔者认为实施工业大数据项目需要关注以下3个关键问题:
(1)数据质量控制问题
原始数据(生数据)质量决定分析结果的质量。企业信息系统数据质量仍然存在问题,例如2014年某大型机车企业ERP系统中近20%物料存在“一物多码”问题。装备物联网数据质量堪忧,某大型制造企业1个月的状态工况数据中,无效工况(如盾构机传回了工程车工况)、重名工况(同一状态工况使用不同名字)、时标混乱(当前时间错误或时标对不齐)等数据质量问题约30%。
(2)多源数据关联问题
层次化的物料表(Bill Of Material, BOM)定义了企业信息系统数据的核心语义结构。针对跨生命周期的研制BOM和实例BOM间结构失配问题,我们提出了中性BOM模型,并以此为核心,向前关联设计制造BOM,向后关联服务保障BOM,形成星型结构,极大地降低了数据关联的复杂度。同时,针对装备物联网数据和外部互联网数据,可以根据其绑定的物理对象(零部件或产品)与相应的BOM节点相关联。从而以BOM为桥梁,关联3个不同来源的工业大数据。
(3)大数据系统集成问题
工业大数据其来源更加广泛,并且装备物联网数据(半结构化数据)和外部互联网数据(非结构化数据)都要与企业信息系统(结构化数据)进行集成,因此要重构数据支撑平台,甚至替换“旧”系统。
3、工业大数据实施工程案例
工业大数据分析提升工程装备服务保障水平,这里分享两个工程案例:
案例1、工业大数据提供故障分析新手段
液压系统是工程机械的关键部件。2013年我们发现液压系统的油缸密封套腐蚀故障数量异常。于是依据企业信息系统记录的液压系统维修历史数据,通过比对相关状态工况数据(装备物联网数据),搜索推荐与故障车辆关系密切的工况,发现车辆油缸换向频率的波动幅度与这些故障高度相关。
进一步,引入互联网上的行政区划数据和历年工程建设数据(外部互联网数据)后,发现2012~2013年期间这些典型故障均发生在沿海省份,从而推断出盐雾环境是导致密封套腐蚀故障的主要诱因。
案例2、工业大数据提升备件需求预测精度
随着工程装备增量市场增长乏力,以维修保障为主的存量市场成为企业盈利新的增长点。我们利用了企业信息系统中的备件销售订单、采购订单和备件库存状态数据,以及工程物联网采集到的工况数据和外部互联网数据(如每个省的GDP,建筑、交通等规划数据)。
针对30个省市区进行了备件需要预测,平均预测精度为82%,每旬备件需求预测误差在5件或真实值的20%以内。库存水平控制在一个较低的稳定水平,仅为原来库存水平的48%。同时,因为考虑到了20天的配货周期,基于预测的补货策略可以保证现货满足率,消除紧急临时订单。如果按备件库存占有资金1亿元计算,可节约库存资金占用5000万元。
工业大数据是实现智能制造的基础原料,是提升工业生产力、竞争力、创新力的关键要素。然而必须看到,工业大数据是一个正在发展的学科领域,其内涵外延、模型理论、技术方法及其实施策略等还有待发展与创新。唯有结合中国国情认真实践,才能走出中国工业大数据自主之路,实现制造强国的战略目标。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在神经网络模型搭建中,“最后一层是否添加激活函数”是新手常困惑的关键问题——有人照搬中间层的ReLU激活,导致回归任务输出异 ...
2025-12-05在机器学习落地过程中,“模型准确率高但不可解释”“面对数据噪声就失效”是两大核心痛点——金融风控模型若无法解释决策依据, ...
2025-12-05在CDA(Certified Data Analyst)数据分析师的能力模型中,“指标计算”是基础技能,而“指标体系搭建”则是区分新手与资深分析 ...
2025-12-05在回归分析的结果解读中,R方(决定系数)是衡量模型拟合效果的核心指标——它代表因变量的变异中能被自变量解释的比例,取值通 ...
2025-12-04在城市规划、物流配送、文旅分析等场景中,经纬度热力图是解读空间数据的核心工具——它能将零散的GPS坐标(如外卖订单地址、景 ...
2025-12-04在CDA(Certified Data Analyst)数据分析师的指标体系中,“通用指标”与“场景指标”并非相互割裂的两个部分,而是支撑业务分 ...
2025-12-04每到“双十一”,电商平台的销售额会迎来爆发式增长;每逢冬季,北方的天然气消耗量会显著上升;每月的10号左右,工资发放会带动 ...
2025-12-03随着数字化转型的深入,企业面临的数据量呈指数级增长——电商的用户行为日志、物联网的传感器数据、社交平台的图文视频等,这些 ...
2025-12-03在CDA(Certified Data Analyst)数据分析师的工作体系中,“指标”是贯穿始终的核心载体——从“销售额环比增长15%”的业务结论 ...
2025-12-03在神经网络训练中,损失函数的数值变化常被视为模型训练效果的“核心仪表盘”——初学者盯着屏幕上不断下降的损失值满心欢喜,却 ...
2025-12-02在CDA(Certified Data Analyst)数据分析师的日常工作中,“用部分数据推断整体情况”是高频需求——从10万条订单样本中判断全 ...
2025-12-02在数据预处理的纲量统一环节,标准化是消除量纲影响的核心手段——它将不同量级的特征(如“用户年龄”“消费金额”)转化为同一 ...
2025-12-02在数据驱动决策成为企业核心竞争力的今天,A/B测试已从“可选优化工具”升级为“必选验证体系”。它通过控制变量法构建“平行实 ...
2025-12-01在时间序列预测任务中,LSTM(长短期记忆网络)凭借对时序依赖关系的捕捉能力成为主流模型。但很多开发者在实操中会遇到困惑:用 ...
2025-12-01引言:数据时代的“透视镜”与“掘金者” 在数字经济浪潮下,数据已成为企业决策的核心资产,而CDA数据分析师正是挖掘数据价值的 ...
2025-12-01数据分析师的日常,常始于一堆“毫无章法”的数据点:电商后台导出的零散订单记录、APP埋点收集的无序用户行为日志、传感器实时 ...
2025-11-28在MySQL数据库运维中,“query end”是查询执行生命周期的收尾阶段,理论上耗时极短——主要完成结果集封装、资源释放、事务状态 ...
2025-11-28在CDA(Certified Data Analyst)数据分析师的工具包中,透视分析方法是处理表结构数据的“瑞士军刀”——无需复杂代码,仅通过 ...
2025-11-28在统计分析中,数据的分布形态是决定“用什么方法分析、信什么结果”的底层逻辑——它如同数据的“性格”,直接影响着描述统计的 ...
2025-11-27在电商订单查询、用户信息导出等业务场景中,技术人员常面临一个选择:是一次性查询500条数据,还是分5次每次查询100条?这个问 ...
2025-11-27