京公网安备 11010802034615号
经营许可证编号:京B2-20210330
制造业 正迈入大数据时代
在德国的工业4.0中,大数据被认为是物理与信息融合中的关键技术。在美国GE提出的工业互联网中,大数据分析作为联机数据处理分析的核心,被认为是重构全球工业、激发生产力的关键技术。在我国提出的《中国制造2025》中,云计算、物联网和大数据作为新一代的信息技术,成为两化融合的关键技术。无论是工业4.0、工业互联网还是《中国制造2025》,智能制造是共同目标,工业互联网是基石,大数据是引擎。
制造业迈入了大数据时代,2012年,GE公司率先明确了“工业大数据”的概念。在制造业,产品的全生命周期从市场规划、设计、制造、销售、维护等过程都会产生大量的结构化和非结构化数据,形成制造业大数据,而这些数据符合大数据的三“V”的特征:规模性、多样性以及高速性。除此以外,制造业大数据还具有多源异构、多尺度、不确定、高噪声等特征。因此,研究和应用制造大数据更具有挑战性,主要体现在制造大数据的存储、管理、分析和展示方面。如何充分挖掘工厂中数据的价值,通过对制造大数据进行分析,提升数字化工厂运行效率,已成为制约数字化工厂向智慧工厂发展的瓶颈。
大数据方法带来思维变化
大数据给我们带来的思考:在制造业能用吗?解决什么问题?制造业大数据到底在哪些领域可以发挥它的作用?
首先,能用否?大数据已经成为解决现实世界问题的方法。要解决现实世界的问题,第一种方法是科学实验,通过实验的方法来发现现实世界的一些规律并解决问题;第二种是通过理论分析和推导方法;第三种是科学计算,模拟仿真成为解决问题的范式;数据科学则是第四种解决问题的范式。目前国外数据科学非常热门,这是一门综合交叉的学科。
大数据方法带来了思维上的变化,主要是从三个方面来看的:从因果到关联,更强调事物之间的相关性而非因果性。从局部到全体,采用全体数据进行分析,而不是随机样本。从精确到混杂,通过数据保证解的优异性,不再一味追求精确的算法。既然大数据已经成为解决问题的方法,那它就是能用的。
其次,能用它来解决工厂的什么问题?大数据方法能为未来工厂的目标服务吗?未来工厂就是智慧工厂,它追求的终极目标是一切都透明化。在制造业不同的阶段,所追求的目标是不一样的。
上个世纪初,制造业追求目标是成本更低,出现了可互换零件原理,形成了大批大量生产模式。在上世纪中叶,为了追求更高的质量,这时候采用了全面质量管理。到上个世纪80年代,市场需要不同的产品,产品的多样化出现,多品种小批量生产模式流行,计算机技术应用到产品设计制造过程,出现了计算机集成制造系统,也就是信息化系统。不同时代企业追求目标不同,所采用的解决问题的方法也不同。未来的智能工厂追求透明化,要达到透明化的目标,可采用的方法就是分析推理,大数据方法事实上是一种分析推理法。因此,从数字化工厂向智能化工厂转化的过程中面对着海量的数据,需要寻找它们相互之间的联系和隐藏规律,实现透明化的目标。
最后,在哪里用?大数据给制造业提供的是一种全方位的全程式的一种服务,在产品全生命周期阶段,从设计到制造、从使用到维护,直到维修阶段,产生的正向数据以及逆向数据,这些数据都能全方位地得到使用。
大数据提供全方位全程服务
在产品的设计中,传统的设计师基于经验灵感和经验,揣度消费者的需求喜好设计产品。在大数据时代,设计师通过对用户行为和需求大数据进行分析,精准量化客户需求,指导设计过程。
在制造阶段,大数据技术可以帮助实现生产过程异常发现、产品质量和生产调度优化等方面。以生产异常发现为例,传统的基于降维手段的异常发现方法,容易破坏信息完整性,不利于设备异常的发现。在大数据模式下,基于制造数据的分析对关键参数进行提取,然后通过聚类分析手段发现设备异常模式,在此基础上对设备控制优化。大数据也能帮助提高产品的质量控制。SPC控制的是整个过程的单个参数,但是单个参数在正常范围为什么还会出现一些质量问题?可能每个参数均处于临界状态,综合后会产生一些质量问题,所以在这个过程中,传统就是数据的筛选、参数分析,这个过程介入了人工的分析来进行质量的预测,数据筛选过程淘汰了许多有效的数据资源,参数分析过程经常存在人工经验判断,使得预测模型对整个产品加工过程信息的描述残缺不全,不能发现产品质量问题的深层次原因(如误差累积)。而在大数据模式下,根据产品的加工工艺过程,对产品质量相关数据按层次进行组织,利用多隐藏层的神经网络深度学习加工过程中产品质量数据的相互作用机理,从而对产品质量问题进行全面、深层次描述。
大数据能提升大规模生产调度的全局性能,大家知道为什么企业生产调度一直会出现问题,我们做的计划赶不上变化。因为所做的计划,是在一个理想状态下考虑约束做出的。笔者做生产优化调度长达20多年,一直在寻找一种最优的解决方案,研究智能方法,例如:遗传算法、蚂蚁算法等。但随着工艺的复杂、环境的复杂、工艺的规模,整个问题规模越来越大的时候,它已经是一个很难解决的问题。传统的智能调度方法难以求解大规模的调度问题,基于规则和瓶颈的方法在大规模问题中又很难得到全局优化;大数据带来了新思路,它采用全局的数据之间的关联关系,从而形成全局的调度方案,能够解决大规模生产中的全局调度问题。
大数据能为产品的运营维护服务,很典型的就是GE的案例,建立一个平台,为航空发动机的监控、运行监测、故障诊断提供一个全方位的服务。在产品的运行和维护过程中,大数据模式一改传统方法被动的运维模式,通过采集和分析智能设备的传感器数据,进行大数据分析,主动进行产品的安全监测、故障诊断,优化产品的运行过程。大数据应用过程中需要的是什么?首先需要的是能够采集到数据,也就是需要产品是一个智能化的产品,所以在智能制造中,首先要有智能化的产品,安装传感器,能够实时地传递数据,为后面的运行、维护服务提供依据。
大数据不只是关于数据,而是采用传统及新的分析方法来分析所有数据。针对大数据分析的结果采取行动来提升业务才是最重要的。随着大数据技术的不断发展,国内外已对大数据在制造领域中的应用进行了一些开拓性的研究,代表性的有GE工业互联网解决方案、Smart Factory计划、SAP HANA平台和Invensys数据分析平台,并已在农夫山泉、百事饮料等公司应用。三一重工利用大数据技术通过对地理位置数据的关联分析发现泵车主油缸故障与沿海地区杭深高铁建设的强相关性,确定了沿海地区的盐雾环境和水质是导致油缸密封体腐蚀的主要原因。日本小松公司通过对挖掘机安装传感器与GPS定位系统,从而实时监控车辆运行情况,并通过大数据分析,对未来挖掘机市场的需求进行预测从而调整生产、对用户的使用习惯进行分析,提出建议,从而降低油耗。
以上一些工业案例成为制造业大数据的先驱,然而,目前绝大多数制造业大数据的应用没能形成系统化的思路和方案,缺乏理论体系的支撑。针对国内在制造业大数据应用基础研究上的空白,我们在2014年申请了国家自然科学基金重点项目“大数据驱动的智能车间运行分析与决策方法研究”,并得到了资助。目前,围绕车间制造大数据之间的耦合作用机理、车间性能的演化规律、车间运行过程的调控机制三个基础科学问题进行科学研究,来探索大数据在智能制造车间的运行情况。解决问题的思路是一切都用数据来说话,这是利用大数据来解决工程问题的科学研究思路。首先是数据化:将设备状态参数、计划执行情况等运行参数,以及质量、交货期等性能指标数据化;然后分析这些数据之间的关联关系,用数据挖掘的方法预测交货准时率、产品合格率等车间性能的演化规律;从演化规律中,发现质量指标中某数据异常,找到影响该异常数据的关键参数,最后对关键数据进行控制,保证交货期和产品质量。为了实现大数据应用,我们提出了大数据驱动的智慧工厂,它是生产车间、物联网、云端、移动互联的有机融合。利用物联网技术,使得车间生产过程、物流及之后的销售、服务过程具备感知能力;全生命周期内产生的各种制造数据保存到云端;借助大数据处理与分析技术,依托云计算平台,帮助分析数字工厂运行过程,提供决策支持,并通过移动互联方式展现。目前我们在晶圆制造的车间和发动机装配车间,开展了一系列的工作。
我认为,实现以数据感知、数据处理分析、制造过程决策与支持、数据可视化技术为核心的智慧工厂已经成为趋势,大数据产业链及技术体系逐渐成熟,大数据必将加速数字工厂向智慧工厂的转型。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据分析、质量控制、科研实验等场景中,数据波动性(离散程度)的精准衡量是判断数据可靠性、稳定性的核心环节。标准差(Stan ...
2026-01-29在数据分析、质量检测、科研实验等领域,判断数据间是否存在本质差异是核心需求,而t检验、F检验是实现这一目标的经典统计方法。 ...
2026-01-29统计制图(数据可视化)是数据分析的核心呈现载体,它将抽象的数据转化为直观的图表、图形,让数据规律、业务差异与潜在问题一目 ...
2026-01-29箱线图(Box Plot)作为数据分布可视化的核心工具,能清晰呈现数据的中位数、四分位数、异常值等关键统计特征,广泛应用于数据分 ...
2026-01-28在回归分析、机器学习建模等数据分析场景中,多重共线性是高频数据问题——当多个自变量间存在较强的线性关联时,会导致模型系数 ...
2026-01-28数据分析的价值落地,离不开科学方法的支撑。六种核心分析方法——描述性分析、诊断性分析、预测性分析、规范性分析、对比分析、 ...
2026-01-28在机器学习与数据分析领域,特征是连接数据与模型的核心载体,而特征重要性分析则是挖掘数据价值、优化模型性能、赋能业务决策的 ...
2026-01-27关联分析是数据挖掘领域中挖掘数据间潜在关联关系的经典方法,广泛应用于零售购物篮分析、电商推荐、用户行为路径挖掘等场景。而 ...
2026-01-27数据分析的基础范式,是支撑数据工作从“零散操作”走向“标准化落地”的核心方法论框架,它定义了数据分析的核心逻辑、流程与目 ...
2026-01-27在数据分析、后端开发、业务运维等工作中,SQL语句是操作数据库的核心工具。面对复杂的表结构、多表关联逻辑及灵活的查询需求, ...
2026-01-26支持向量机(SVM)作为机器学习中经典的分类算法,凭借其在小样本、高维数据场景下的优异泛化能力,被广泛应用于图像识别、文本 ...
2026-01-26在数字化浪潮下,数据分析已成为企业决策的核心支撑,而CDA数据分析师作为标准化、专业化的数据人才代表,正逐步成为连接数据资 ...
2026-01-26数据分析的核心价值在于用数据驱动决策,而指标作为数据的“载体”,其选取的合理性直接决定分析结果的有效性。选对指标能精准定 ...
2026-01-23在MySQL查询编写中,我们习惯按“SELECT → FROM → WHERE → ORDER BY”的语法顺序组织语句,直觉上认为代码顺序即执行顺序。但 ...
2026-01-23数字化转型已从企业“可选项”升级为“必答题”,其核心本质是通过数据驱动业务重构、流程优化与模式创新,实现从传统运营向智能 ...
2026-01-23CDA持证人已遍布在世界范围各行各业,包括世界500强企业、顶尖科技独角兽、大型金融机构、国企事业单位、国家行政机关等等,“CDA数据分析师”人才队伍遵守着CDA职业道德准则,发挥着专业技能,已成为支撑科技发展的核心力量。 ...
2026-01-22在数字化时代,企业积累的海量数据如同散落的珍珠,而数据模型就是串联这些珍珠的线——它并非简单的数据集合,而是对现实业务场 ...
2026-01-22在数字化运营场景中,用户每一次点击、浏览、交互都构成了行为轨迹,这些轨迹交织成海量的用户行为路径。但并非所有路径都具备业 ...
2026-01-22在数字化时代,企业数据资产的价值持续攀升,数据安全已从“合规底线”升级为“生存红线”。企业数据安全管理方法论以“战略引领 ...
2026-01-22在SQL数据分析与业务查询中,日期数据是高频处理对象——订单创建时间、用户注册日期、数据统计周期等场景,都需对日期进行格式 ...
2026-01-21