京公网安备 11010802034615号
经营许可证编号:京B2-20210330
上个世纪九十年代,科学家们在进行气象地图分析、大物理仿真计算、基因图谱分析等基础科学研究
时提出了“大数据”这个概念。进入21世纪,互联网、电子商务、移动互联网、社交网络、物联网等技术蓬
勃发展,大数据成为这些新一代信息技术发展的必然产物。大数据具有数据量大、数据类型复杂、数据处
理实时性要求高等特点,大数据分析在互联网和电子商务领域的广泛应用产生了巨大的商业价值,得到世
界各国的高度重视。全球著名战略咨询公司麦肯锡认为,大数据是创新、竞争和生产力的下一个领域。
工业大数据也是一个全新的概念,从字面上理解,工业大数据是指在工业领域信息化应用中所产生的
大数据。随着信息化与工业化的深度融合,信息技术渗透到了工业企业产业链的各个环节,条形码、二维
码、RFID、工业传感器、工业自动控制系统、工业物联网、ERP、CAD/CAM/CAE/CAI等技术在工业企业中
得到广泛应用,尤其是互联网、移动互联网、物联网等新一代信息技术在工业领域的应用,工业企业也进
入了互联网工业的新的发展阶段,工业企业所拥有的数据也日益丰富。工业企业中生产线处于高速运转,
由工业设备所产生、采集和处理的数据量远大于企业中计算机和人工产生的数据,从数据类型看也多是非
结构化数据,生产线的高速运转则对数据的实时性要求也更高。因此,工业大数据应用所面临的问题和挑
战并不比互联网行业的大数据应用少,某些情况下甚至更为复杂。
工业大数据应用将带来工业企业创新和变革的新时代。通过互联网、移动物联网等带来的低成本感
知、高速移动连接、分布式计算和高级分析,信息技术和全球工业系统正在深入融合,给全球工业带来深
刻的变革,创新企业的研发、生产、运营、营销和管理方式。这些创新不同行业的工业企业带来了更快的
速度、更高的效率和更高的洞察力。工业大数据的典型应用包括产品创新、产品故障诊断与预测、工业生
产线物联网分析、工业企业供应链优化和产品精准营销等各个方面。
首先看产品创新的应用。客户与工业企业之间的交互和交易行为将产生大量数据,挖掘和分析这些客
户动态数据,能够帮助客户参与到产品的需求分析和产品设计等创新活动中,为产品创新作出贡献。福特
公司是这方面的表率,他们将大数据技术应用到了福特福克斯电动车的产品创新和优化中,这款车成为了
一款名副其实的“大数据电动车”。第一代福特福克斯电动车在驾驶和停车时产生大量数据。在行驶中,司
机持续地更新车辆的加速度、刹车、电池充电和位置信息。这对于司机很有用,但数据也传回福特工程师
那里,以了解客户的驾驶习惯,包括如何、何时以及何处充电。即使车辆处于静止状态,它也会持续将车
辆胎压和电池系统的数据传送给最近的智能电话。这种以客户为中心的大数据应用场景具有多方面的好处,因为大数据实现了宝贵的新型产品创新和协作方式。司机获得有用的最新信息,而位于底特律的工程
师汇总关于驾驶行为的信息,以了解客户,制订产品改进计划,并实施新产品创新。而且,电力公司和其
他第三方供应商也可以分析数百万英里的驾驶数据,以决定在何处建立新的充电站,以及如何防止脆弱的
电网超负荷运转。
第二个典型应用是产品故障诊断与预测,这可以被用于产品售后服务与产品改进。无所不在的传感
器、互联网技术的引入使得产品故障实时诊断变为现实,大数据应用、建模与仿真技术则使得预测动态性
成为可能。在马航MH370失联客机搜寻过程中,波音公司获取的发动机运转数据对于确定飞机的失联路径
起到了关键作用。我们就拿波音公司飞机系统作为案例,看看大数据应用在产品故障诊断中如何发挥作
用。在波音的飞机上,发动机、燃油系统、液压和电力系统等数以百计的变量组成了在航状态,这些数据
不到几微秒就被测量和发送一次。以波音737为例,发动机在飞行中每30分钟就能产生10TB数据。这些数
据不仅仅是未来某个时间点能够分析的工程遥测数据,而且还促进了实时自适应控制、燃油使用、零件故
障预测和飞行员通报,能有效实现故障诊断和预测。再看一个通用电气(GE)的例子,位于美国亚特兰大
的GE能源监测和诊断(M&D)中心,收集全球50多个国家上千台GE燃气轮机的数据,每天就能为客户收
集10G的数据,通过分析来自系统内的传感器振动和温度信号的恒定大数据流,这些大数据分析将为GE公
司对燃气轮机故障诊断和预警提供支撑。风力涡轮机制造商Vestas也通过对天气数据及期涡轮仪表数据进
行交叉分析,从而对风力涡轮机布局进行改善,由此增加了风力涡轮机的电力输出水平并延长了服务寿
命。
第三个典型应用是工业物联网生产线的大数据应用。现代化工业制造生产线安装有数以千计的小型传
感器,来探测温度、压力、热能、振动和噪声。因为每隔几秒就收集一次数据,利用这些数据可以实现很
多形式的分析,包括设备诊断、用电量分析、能耗分析、质量事故分析(包括违反生产规定、零部件故
障)等。首先,在生产工艺改进方面,在生产过程中使用这些大数据,就能分析整个生产流程,了解每个
环节是如何执行的。一旦有某个流程偏离了标准工艺,就会产生一个报警信号,能更快速地发现错误或者
瓶颈所在,也就能更容易解决问题。利用大数据技术,还可以对工业产品的生产过程建立虚拟模型,仿真
并优化生产流程,当所有流程和绩效数据都能在系统中重建时,这种透明度将有助于制造商改进其生产流
程。再如,在能耗分析方面,在设备生产过程中利用传感器集中监控所有的生产流程,能够发现能耗的异
常或峰值情形,由此便可在生产过程中优化能源的消耗,对所有流程进行分析将会大大降低能耗。
第四个典型应用是工业供应链的分析和优化。当前,大数据分析已经是很多电子商务企业提升供应链
竞争力的重要手段。例如,电子商务企业京东商城,通过大数据提前分析和预测各地商品需求量,从而提
高配送和仓储的效能,保证了次日货到的客户体验。RFID等产品电子标识技术、物联网技术以及移动互联
网技术能帮助工业企业获得完整的产品供应链的大数据,利用这些数据进行分析,将带来仓储、配送、销
售效率的大幅提升和成本的大幅下降。以海尔公司为例,海尔公司供应链体系很完善,它以市场链为纽
带,以订单信息流为中心,带动物流和资金流的运动,整合全球供应链资源和全球用户资源。在海尔供应
链的各个环节,客户数据、企业内部数据、供应商数据被汇总到供应链体系中,通过供应链上的大数据采
集和分析,海尔公司能够持续进行供应链改进和优化,保证了海尔对客户的敏捷响应。美国较大的OEM供
应商超过千家,为制造企业提供超过1万种不同的产品,每家厂商都依靠市场预测和其他不同的变量,如销
售数据、市场信息、展会、新闻、竞争对手的数据,甚至天气预报等来销售自己的产品。利用销售数据、
产品的传感器数据和出自供应商数据库的数据,工业制造企业便可准确地预测全球不同区域的需求。由于
可以跟踪库存和销售价格,可以在价格下跌时买进,所以制造企业便可节约大量的成本。如果再利用产品
中传感器所产生的数据,知道产品出了什么故障,哪里需要配件,他们还可以预测何处以及何时需要零
件。这将会极大地减少库存,优化供应链。
工业大数据应用的价值潜力巨大。但是,实现这些价值还有很多工作要做。一个是大数据意识建立的
问题。过去,也有这些大数据,但由于没有大数据的意识,数据分析手段也不足,很多实时数据被丢弃或
束之高阁,大量数据的潜在价值被埋没。还有一个重要问题是数据孤岛的问题。很多工业企业的数据分布
于企业中的各个孤岛中,特别是在大型跨国公司内,要想在整个企业内提取这些数据相当困难。因此,工
业大数据应用一个重要议题是集成应用。
2013年9月5日,工业和信息化部正式发布《信息化和工业化深度融合专项行动计划(2013~2018
年)》,在其中的互联网与工业融合创新行动中明确提出要促进工业大数据集成应用。随着互联网与工业
融合创新,工业大数据集成应用将成为工业互联网应用的核心。据了解,专项行动计划把工业大数据集成
应用分为三个层面,分别对应骨干企业大数据应用、中小企业大数据应用和行业大数据应用。一是,对骨
干企业具备条件建设大数据应用系统,行动计划支持和鼓励典型行业骨干企业在工业生产经营过程中应用
大数据技术,提升生产制造、供应链管理、产品营销及服务等环节的智能决策水平和经营效率。这是突出
大数据技术自主应用,对骨干企业内外部数据进行分析。二是,支持建设第三方大数据平台建设,面向中
小制造企业提供精准营销、互联网金融等生产性服务。这是突出大数据的第三方专业化商业服务,为中小
企业提供工业大数据云服务。三是,推动大数据在工业行业管理和经济运行中的应用,形成行业大数据平
台,促进信息共享和数据开放,实现产品、市场和经济运行的动态监控、预测预警,提高行业管理、决策
与服务水平。这是政府参与的行业大数据云平台建设,服务行业指导和科学决策。
从技术层面看,工业大数据集成应用将基于Hadoop的分布式计算平台、内存计算平台和实时的流计算
平台来整合搭建。工业物联网中存在多种传感器,存在多种通讯协议和数据格式,各种工业数据的采集和
解析将比其他行业更为复杂,要求工业大数据采集总线具有更好的集成性。工业数据处理要求从实时、准
实时到离线,Hadoop平台解决的是大数据离线批处理计算的需求,内存计算解决的是大数据准实时迭代分
析的需求,流计算平台解决的是生产线实时数据分析的需求。工业大数据的数据挖掘与可视化也要符合工
业生产的具体要求,建立工业生产领域的优化、运筹、决策分析模型。工业大数据的安全事关生产质量和
安全生产,数据分析的准确性显得更为重要。
总之,无论从应用和技术角度看,工业大数据集成应用将成为两化深度融合的重点任务,成为建立互
联网工业和智慧工业的基石。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据工作的全流程中,数据清洗是最基础、最耗时,同时也是最关键的核心环节,无论后续是做常规数据分析、可视化报表,还是开展 ...
2026-03-20在大数据与数据驱动决策的当下,“数据分析”与“数据挖掘”是高频出现的两个核心概念,也是很多职场人、入门学习者容易混淆的术 ...
2026-03-20在CDA(Certified Data Analyst)数据分析师的全流程工作闭环中,统计制图是连接严谨统计分析与高效业务沟通的关键纽带,更是CDA ...
2026-03-20在MySQL数据库优化中,分区表是处理海量数据的核心手段——通过将大表按分区键(如时间、地域、ID范围)分割为多个独立的小分区 ...
2026-03-19在商业智能与数据可视化领域,同比、环比增长率是分析数据变化趋势的核心指标——同比(YoY)聚焦“长期趋势”,通过当前周期与 ...
2026-03-19在数据分析与建模领域,流传着一句行业共识:“数据决定上限,特征决定下限”。对CDA(Certified Data Analyst)数据分析师而言 ...
2026-03-19机器学习算法工程的核心价值,在于将理论算法转化为可落地、可复用、高可靠的工程化解决方案,解决实际业务中的痛点问题。不同于 ...
2026-03-18在动态系统状态估计与目标跟踪领域,高精度、高鲁棒性的状态感知是机器人导航、自动驾驶、工业控制、目标检测等场景的核心需求。 ...
2026-03-18“垃圾数据进,垃圾结果出”,这是数据分析领域的黄金法则,更是CDA(Certified Data Analyst)数据分析师日常工作中时刻恪守的 ...
2026-03-18在机器学习建模中,决策树模型因其结构直观、易于理解、无需复杂数据预处理等优势,成为分类与回归任务的首选工具之一。而变量重 ...
2026-03-17在数据分析中,卡方检验是一类基于卡方分布的假设检验方法,核心用于分析分类变量之间的关联关系或实际观测分布与理论期望分布的 ...
2026-03-17在数字化转型的浪潮中,企业积累的数据日益庞大且分散——用户数据散落在注册系统、APP日志、客服记录中,订单数据分散在交易平 ...
2026-03-17在数字化时代,数据分析已成为企业决策、业务优化、增长突破的核心支撑,从数据仓库搭建(如维度表与事实表的设计)、数据采集清 ...
2026-03-16在数据仓库建设、数据分析(尤其是用户行为分析、业务指标分析)的实践中,维度表与事实表是两大核心组件,二者相互依存、缺一不 ...
2026-03-16数据是CDA(Certified Data Analyst)数据分析师开展一切工作的核心载体,而数据读取作为数据生命周期的关键环节,是连接原始数 ...
2026-03-16在用户行为分析实践中,很多从业者会陷入一个核心误区:过度关注“当前数据的分析结果”,却忽视了结果的“泛化能力”——即分析 ...
2026-03-13在数字经济时代,用户的每一次点击、浏览、停留、转化,都在传递着真实的需求信号。用户行为分析,本质上是通过收集、整理、挖掘 ...
2026-03-13在金融、零售、互联网等数据密集型行业,量化策略已成为企业挖掘商业价值、提升决策效率、控制经营风险的核心工具。而CDA(Certi ...
2026-03-13在机器学习建模体系中,随机森林作为集成学习的经典算法,凭借高精度、抗过拟合、适配多场景、可解释性强的核心优势,成为分类、 ...
2026-03-12在机器学习建模过程中,“哪些特征对预测结果影响最大?”“如何筛选核心特征、剔除冗余信息?”是从业者最常面临的核心问题。随 ...
2026-03-12