京公网安备 11010802034615号
经营许可证编号:京B2-20210330
工业大数据的真正意义和价值
近年来,以物联网、移动互联网、大数据、云计算为代表的新一代信息技术,以3D打印、机器人、人机协作为代表的新型制造技术,与新能源、新材料与生物科技呈现多点突破、交叉融合,智能制造技术创新不断取得新突破。2016年是我国“十三五”开局之年,也是我国系统推进智能制造发展元年,智能制造将成为实施《中国制造2025》的重要抓手,推动我国经济发展保持中高速增长,助力产业完成中高端升级。
在西方国家有这样一句话:To live well,a nation mustproduce well,说明制造业是一个国家综合国力最重要的体现,也是决定民众生活质量的重要条件。在经历了互联网泡沫和经济危机之后,世界各国,尤其是发达国家开始重新意识到制造业的重要性,也在重新审视自身竞争力的优劣势。第四次科技革命的到来为各个国家提供了发展和转型的机遇,也使他们面临竞争力格局变化的挑战,智能制造成为世界各国竞争的新战场。无论是德国提出的“工业4. 0 国家战略”,美国提出的“国家制造业创新网络(NNMI)计划”,或是日本的“工业价值链计划(IVI)”等,无不围绕着制造业这个核心。中国改革开放三十多年来,综合国力和人民生活水平的提升过程中,制造业的快速发展起到了决定性的作用,中国成为世界制造业的新中心,也连续几年成为“世界制造力竞争指数”最强的国家。在新一轮的制造业革命中,中国也感受到来自世界各国新技术战略的压力,相继提出“中国制造2025”,“互联网+ ”和“供给侧改革”等多项措施。
每一次制造革命的进步,除了我们能够可见的技术要素以外,更重要的是这背后的制造哲学的进步。现代制造业从第二次科技革命到现在,经历了标准化、合理化+ 规范化、自动化+集成化、网络化+ 信息化四个阶段。这背后的制造哲学可以概括为:以低成本生产高质量的产品;通过全流程改善降低浪费、次品和事故;通过产品全生命周期的数据管理,为用户提供所需要的能力和服务。在以上几个阶段的基础上,现在的制造系统正处在向智能化+ 客制化迈进的阶段,目标是实现零故障和预测型的生产系统,并在无忧的生产环境中以低成本快速实现用户的客制化需求。
那么,如何实现智能制造?有些人说大数据是实现智能制造的核心技术,也有人说要靠互联网、信息物理系统技术(CPS),或是人工智能和机器人等。如果大数据是智能制造的核心驱动力,那么我们该怎么去定义和使用大数据?关于这个问题,我在《工业大数据》这本书中曾表达过一个观点:大数据并不是目的,而是看待问题的一种途径和解决问题的一种手段。通过分析数据,可以预测需求、预测制造、解决和避免不可见问题的风险,和利用数据去整合产业链和价值链,这才是大数据的核心目的。
大数据与智能制造之间的关系可以总结为:制造系统中问题的发生和解决的过程中会产生大量数据,通过对这些数据的分析和挖掘可以了解问题产生的过程、造成的影响和解决的方式,这些信息被抽象化建模后转化成知识,再利用知识去认识、解决和避免问题,核心是从以往依靠人的经验(experiencebased),转向依靠挖掘数据中隐性的线索(evidence based),使得制造知识能够被更加高效和自发地产生、利用和传承。因此,问题和知识是目的,而数据则是一种手段。今天我们来谈利用大数据实现智能制造,是因为大数据已经成为一个日益明显的现象,而在制造系统和商业环境变得日益复杂的今天,利用大数据去解决问题和积累知识或许是更加高效和便捷的方式。
大数据的目的并不是追求数据量大,而是通过系统式地数据收集和分析手段,实现价值的最大化。所以推动智能制造的并不是大数据本身,而是大数据的分析技术。在新制造革命的转型中,是否能够更加有效地利用好大数据,决定了能否在竞争中脱颖而出。在现在的制造中,存在着许多无法被定量、无法被决策者掌握的不确定因素,这些不确定因素既存在于制造过程中,也存在于制造过程之外的使用过程中。前三次工业革命主要解决的都是可见的问题,例如避免产品缺陷、避免加工失效、提升设备效率和可靠性、避免设备故障和安全问题等。这些问题在工业生产中由于可见可测量,往往比较容易避免和解决。不可见的问题通常表现为设备的性能下降、健康衰退、零部件磨损、运行风险升高等。这些因素由于其很难通过测量被定量化,往往是工业生产中不可控的风险,大部分可见的问题都是这些不可见的因素积累到一定程度所造成的。
因此,我、倪军教授和王安正教授在本书中阐述了大数据推动智能制造的三个方向:第一个方向是利用数据来了解和解决可见的问题;第二个方向是利用数据来分析和预测不可见的问题,从仅仅明白解决问题的“knowhow”,进一步理解问题产生的原因,从而避免可见的问题;第三个方向则是从数据中挖掘新的知识,再利用知识去重新定义问题,使得可见或不可见的问题都可以在制造系统中避免。在第一个方向上,许多国家已经有了比较成熟的积累,也形成了各自独特的制造文化,本书中我们会为读者详细解读这些国家的经验和得失。在第二个和第三个方向上,我们也做了许多年的研究和应用,形成了一套较为完整的体系和方法论,在本书中也会结合案例为读者进行详细介绍。借助本书,我们不仅要向读者介绍大数据和智能制造的技术,更重要的是传达一种思维方式,以及对智能制造的理解、解决问题的逻辑和重新定义制造的思考方式。
相关:得大数据者得新工业革命先机
数据无限多时,就接近真实世界的本原。人类征服世界的前提是认识世界,既然借助大数据已经无限接近了真实世界,也就不必画蛇添足了,还是保持真实数据原貌最好,而且,认识世界的能力越强,人类征服世界和改造世界的能力也越强。
世界经济论坛第十届新领军者年会即夏季达沃斯论坛即将在天津举行,主题为“第四次工业革命——转型的力量”。届时,全球90多个国家和地区的超过1500位各界领军人物将集中探讨第四次工业革命对未来经济、社会、生态和文化的重要影响。今年1月下旬在瑞士小镇举行的达沃斯年会,主题也是“掌控第四次工业革命”,主要讨论第四次工业革命将如何改变人类生产、分配和消费模式,如何应对由此带来的挑战。世界顶级企业家与智库一年内两度探讨同一主题,在达沃斯论坛历史上还是首次。世界精英如此心仪新工业革命,盖因世界经济遇到了瓶颈,人们急切期望从新工业革命中找到突破口,找到人类可持续发展的钥匙。而要理解新工业革命,先得弄清大数据革命。
一般认为,大数据的数量级是在“太字节”即2的40次方以上,一般软件人员难以收集、存储、管理和分析的数据,而且这种认定还是相对的,随着科技进步,“大”的认定还会不断变化。但仅仅因为“大”而称之为大数据,风靡全球的大数据革命就没有太大意义了。在小数据时代,我们只能有选择性采集抽样数据、局部数据和片面数据,有时甚至在无法获得实证时纯粹靠经验、理论、假设和价值观去发现未知领域的规律。结果只能是对真实世界的抽象归纳与推理,这就不可避免包含了人的心理和主观因素。同时,由于样本的局部性,时间非全天候性,归纳推理中的主客观偏差,有时可能出现“蝴蝶效应”,差之毫厘,谬以千里。
大数据的真正意义在于:通过传感器,实现真实世界的全方位连接,得到全方位实时数据,交换、整合和云计算,逼近真实世界。
小数据追求“小”、“精”、“优”;大数据追求的是“多”、“杂”、“更优”。小数据时代,受科技水平的限制,只能依据随机样本,大数据则要求所有数据,在小数据时代只有5%的数据符合样本结构化要求,剩下的95%数据都被排斥在外了。大数据则良莠不拒,不求随机样本,而是全体数据;不求精确性,而是混杂性。小数据探求因果关系,即知道“为什么”,以便归纳推理和预测;而大数据只知道相关关系,不必知道因果关系,只要知道“是什么”不必知道“为什么”。小数据追求精确、完美,往往导致不精确、不完美;大数据不求精确、不求完美,反而导致了观测客观世界的更精确、更完美。如2009年谷歌通过大数据分析准确地得出什么地方发现了H1N1禽流感,而且判断非常及时,比美国疾控中心的判断结论要早一两周。美国安大略理工学院卡罗琳·麦格雷戈博士利用软件预测早产儿的病情,不仅比专业医生及时,而且一些病状,医生不能发现,而计算机能发现。这些人都没有医疗方面的专业背景。这样的例子在大数据时代还有很多。正如“大数据时代的预言家”,牛津大学教授维多克·迈尔-舍恩伯格所言:“在不久的将来,世界许多依靠人类判断力的领域都会被计算机系统所改变甚至取代。”这看似是一个矛盾的命题,其实是一个方法论上的革命,即“大数据革命”。
明代著名思想家洪应明说过:“文章极处无奇巧,人品极处只本然。”一个人写文章写到登峰造极的境界时,其实并没有什么写作艺术可言,只是把内心的真实感受真实地表现出来,让读者从内心产生共鸣。一个人的品德修养达到炉火纯青的境界时,就能“随心所欲不逾矩”,让人回归到纯真朴实的本然之性而已。大数据革命与此异曲同工:“工业革命无奇巧,数据大时只本然”。数据无限多时,就接近真实世界的本原。人类征服世界的前提是认识世界,既然借助大数据已经无限接近了真实世界,也就不必画蛇添足了,还是保持真实数据原貌最好,而且,认识世界的能力越强,人类征服世界和改造世界的能力也越强。
大数据“多”、“快”“好”“省”的优点奠定了新工业革命的基石。“数据多”,随着科技水平的进一步发展,大数据将无限逼近真实世界。“速度快”,全天候随时实现信息交换,没有时滞。“效果好”,大数据增加了人类的“观测”能力。美国麻省理工学院布伦乔尔森将大数据称之为人类社会行为观测的“显微镜”,就像望远镜让我们能洞察遥远的星河,显微镜让我们观察微小的细胞一样,大数据将帮助我们完成在通常的眼光下无法完成的工作。
新工业革命,本质上是智能革命,而智能革命的基础是信息化,大数据是根本。没有大数据对客观事物全面、快速、真实、准确的信息反馈,任何智能设备都不可能实现真正的智能。因此,西方学者将即将来临的新工业革命也称之“后信息时代的革命”,归根到底,这是“大数据的革命”。以至于知名信息专家涂子沛说:“数据可以治国,也可以强国”,“得数据者得天下”。借用涂子沛的这句话,我们还可以说:“数据可以治业,数据可以兴业,得大数据者将占据新工业革命之先机!”
工业大数据的四种用途和两大价值
随着新一代信息技术与制造业的深度融合,工业企业的运营管理,越来越依赖工业大数据。工业大数据的潜在价值也日益呈现。随着越来越多的生产设备、零部件、产品以及人力物力不断加入工业互联网,也致使工业大数据呈现出爆炸性增长的趋势。
对工业企业而言,工业大数据有四种区别于一般大数据应用的特殊用途,能够带来两大价值:
图 工业大数据的产生和应用
优化网络:在一个网络系统内实现互联的各种设备或机器,可以通过互联网相互协作,提高网络整体的运营效率。在医疗领域也是如此,如果将到医生和护士等医疗数据互联,数据就可以无缝地传输给医疗机构和病人,等待的时间将会更短,能够更迅速地帮助病人使用正确的医疗设备,从而使得医疗设备利用率更高,医疗服务质量更好。在交通领域也是如此,如果将许多车辆实现互联之后,就会知道自己的位置和目的地,同时能够了解到网络系统内其他车辆的位置和目的地,允许优化路由来寻找到最有效的人工智能解决方案。
优化运维:通过工业大数据可以实现最优化、低成本,并有利于整个设备或机器的运行维护。例如,将生产设备、零部件都联网之后,将实现一个可监测的生产状态,可以在正确的时间将最优数量的零部件交付到准确的位置,将减少零部件库存需求和维护成本,提升设备或机器的稳定性。
恢复系统:通过建立广泛的大数据信息,可以帮助网络系统在发生毁灭性打击之后更加快速、有效的进行恢复。例如,当地震或其他自然灾害发生时,可以用智能仪表、传感器和其他智能设备和系统组成的网络来进行快速检测,隔离发生故障的设备或机器,不至于发生串联而导致更大规模的故障发生。
自主学习:每台设备或机器的操作经验可以聚合为一个大数据,使得整个设备或机器能够自主学习。这种自主学习的方式是不可能在单个机器上来实现的。例如,从许多飞机上收集的数据加上位置和飞行的历史数据,才可以提供有关各种环境下飞机性能的信息。当越来越多的机器连接在一个系统中,产生无数只能数据的结果将是网络系统的不断扩大并能自主学习,而且越来越智能化。
毫无疑问,通过工业大数据的四种用途,能够为工业企业带来两大价值。即:增加收入、降低成本。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在大数据技术飞速迭代、数字营销竞争日趋激烈的今天,“精准触达、高效转化、成本可控”已成为企业营销的核心诉求。传统广告投放 ...
2026-04-24在游戏行业竞争白热化的当下,用户流失已成为制约游戏生命周期、影响营收增长的核心痛点。据行业报告显示,2024年移动游戏平均次 ...
2026-04-24 很多业务负责人开会常说“我们要数据驱动”,最后却变成“看哪张报表数据多就用哪个”,往往因为缺乏一套结构性的方法去搭建 ...
2026-04-24在Power BI数据可视化分析中,切片器是连接用户与数据的核心交互工具,其核心价值在于帮助使用者快速筛选目标数据、聚焦分析重点 ...
2026-04-23以数为据,以析促优——数据分析结果指导临床技术改进的实践路径 临床技术是医疗服务的核心载体,其水平直接决定患者诊疗效果、 ...
2026-04-23很多数据分析师每天盯着GMV、DAU、转化率,但当被问到“哪些指标是所有企业都需要的”“哪些指标是因行业而异的”“北极星指标和 ...
2026-04-23近日,由 CDA 数据科学研究院重磅发布的《2026 全球数智化人才指数报告》,被中国教育科学研究院官方账号正式收录, ...
2026-04-22在数字化时代,客户每一次点击、浏览、下单、咨询等行为,都在传递其潜在需求与决策倾向——这些按时间顺序串联的行为轨迹,构成 ...
2026-04-22数据是数据分析、建模与业务决策的核心基石,而“数据清洗”作为数据预处理的核心环节,是打通数据从“原始杂乱”到“干净可用” ...
2026-04-22 很多数据分析师每天盯着GMV、转化率、DAU等数字看,但当被问到“什么是指标”“指标和维度有什么区别”“如何搭建一套完整的 ...
2026-04-22在数据分析与业务决策中,数据并非静止不变的数值,而是始终处于动态波动之中——股市收盘价的每日涨跌、企业月度销售额的起伏、 ...
2026-04-21在数据分析领域,当研究涉及多个自变量与多个因变量之间的复杂关联时,多变量一般线性分析(Multivariate General Linear Analys ...
2026-04-21很多数据分析师精通描述性统计,能熟练计算均值、中位数、标准差,但当被问到“用500个样本如何推断10万用户的真实满意度”“这 ...
2026-04-21在数据处理与分析的全流程中,日期数据是贯穿业务场景的核心维度之一——无论是业务报表统计、用户行为追踪,还是风控规则落地、 ...
2026-04-20在机器学习建模全流程中,特征工程是连接原始数据与模型效果的关键环节,而特征重要性分析则是特征工程的“灵魂”——它不仅能帮 ...
2026-04-20很多数据分析师沉迷于复杂的机器学习算法,却忽略了数据分析最基础也最核心的能力——描述性统计。事实上,80%的商业分析问题, ...
2026-04-20在数字化时代,数据已成为企业决策的核心驱动力,数据分析与数据挖掘作为解锁数据价值的关键手段,广泛应用于互联网、金融、医疗 ...
2026-04-17在数据处理、后端开发、报表生成与自动化脚本中,将 SQL 查询结果转换为字符串是一项高频且实用的操作。无论是拼接多行数据为逗 ...
2026-04-17面对一份上万行的销售明细表,要快速回答“哪个地区卖得最好”“哪款产品增长最快”“不同客户类型的购买力如何”——这些看似复 ...
2026-04-17数据分析师一天的工作,80% 的时间围绕表格结构数据展开。从一张销售明细表到一份完整的分析报告,表格结构数据贯穿始终。但你真 ...
2026-04-16