京公网安备 11010802034615号
经营许可证编号:京B2-20210330
民机客服工程的大数据应用
大数据技术正深刻影响着民机产业链的上下游,工业大数据缘起国外,在民机领域大数据应用发展较快,而在国内民机客服工程领域也有所突破。
大数据属于数量大 (Volume)、输入和处理速度快 (Velocity)、数据多样性 (Variety)和价值密度低 (Value) 的复杂、海量信息,无法用传统工具处理分析。大数据可分为三类:一是社交类数据,记录用户行为、反馈数据等;二是商业类数据,包括消费者数据、ERP数据、库存数据以及账目数据等;三是工业类数据,又称机器和传感器数据,包括智能仪表、工业设备传感器、呼叫记录、设备日志等。
目前工业大数据形成了以“工业互联网”为代表的美国模式、“工业4.0”为代表的德国模式和“两化融合”、“互联网 ”为代表的中国模式。
工业大数据作为大数据体系的分支,与其既有共通性,又有特殊性。在共通性方面,都是基于海量数据、分析技术和大数据思维三要素,"数据分析师"以预测为核心,以模型和算法为关键。
客服工程数字化的内在驱动是大数据
当前的民用客机研制不但在传统工程技术体系内追求突破创新,更注重从服务客户角度对产品设计方案实施再开发,即“民机客服工程”。客服工程是对产品定义的开发补充,是对产品使用性能的技术创意,它把产品操作和维修等固有特性转化为外在表现,从而构建起产品全生命周期持续安全健康运行的基础。从技术角度看,民机客服工程更多地使用数理统计和逻辑判断工具,更注重大数据在飞行效率、健康管理等领域的应用。
大数据应用的关键技术分析
数据分析师从数据源获取到产生最终价值,一般经过数据的采集准备、存储管理、计算处理、数据分析和知识展现等五个主要环节。相对于传统挖掘技术,大数据分析的技术突破主要集中在存储管理、计算处理和数据分析三个核心环节。在民机应用方面,又涉及工业物联网、航空电信网等关键技术。
"数据分析师"面对海量数据,传统存储技术一方面是存储和计算物理分离、易受I/O瓶颈制约,另一方面是数据数据冗余、扩展、容错和并发读写能力不足。谷歌文件系统(GFS)和Hadoop分布式文件系统(HDFS)在物理上将计算和存储节点结合在一起,避免了数据密集计算时的I/O堵塞;采取分布式存储架构,以提高并发访问能力,在大文件存储上的表现优异。随着应用和需求的发展,内存型数据库在提高随机、海量小文件频繁读写方面表现优异。
传统关系型数据库采取结构化数据管理方式,优点是数据一致性强,缺点是容差性、并发性较弱。谷歌Big Table和HadoopHBase等新型非关系数据库(NoSQL)通过“键-值”(Key-Value)对、文件等非二维表,提供了处理多源多类非结构化数据的解决方案,由于只关注结果一致性,不追求过程一致性,效率也充分提升。谷歌推出Spanner数据库,可在全球部署100万~1000万台服务器的超大存储系统,通过原子钟进行全局精确同步,在非关系型数据库基础上实现一致性,同时还支持SQL接口,体现两种数据管理技术融合发展的方向。
并行计算关键技术
传统高性能计算的特点是“数据简单、算法复杂”,大数据是典型的数据密集型计算,更重视计算单元和存储单元间的吞吐率。谷歌的MapReduce并行计算技术,通过廉价通用服务器组建系统、添加服务器节点线性扩展系统处理能力,成为应用最为广泛的大数据计算平台。基于MapReduce,业界又发展出多种并行计算技术:一是“边到达边计算”的流计算,如Yahoo的S4和Twitter的Storm;二是针对大规模图数据进行优化的图计算,如谷歌的Pregel;三是将MapReduce内存化以提高实时性的内存批计算, Spark;四是可秒级处理PB级数据的快速交互分析,如谷歌的Dremel。2013年,Hadoop社区推出的将任务调度和资源管理分离、适合多种计算模型的通用MapReduce架构YARN,现已发展成为大数据计算平台的公认标准。
大数据分析技术路线先凭借先验知识人工建立数学模型分析、而后通过大量样本数据进行机器学习。2006 年,谷歌等公司提出增加人工神经网络层数和神经元节点数量,构建深度神经网络以提高训练效果,并在后续试验中得到证实。基于深度神经网络的机器学习技术在语音识别和图像识别等方面取得了较好效果。
工业物联网
工业大数据离不开工业物联网的支撑。第一代工业物联网以模拟信号单向传递为主,布线复杂、抗干扰性差。第二代工业物联网以数字分布式控制系统为代表,信号精度提高但网络实时性和稳定性不足。第三代工业物联网突出现场总线控制,采用全数字、开放式双向通信网络将各控制器与设备互连,而更为便捷、低廉的工业以太网已开始取代现场总线技术。第四代工业物联网的特点是无线传感和通信,突破传统分层控制体系,形成制造、管理、分析、服务的全网一体化架构,同时还具备现场设备感知、实时微处理微计算、微秒级快速响应和复杂环境下稳定传输等能力。
航空电信网
航空电信网(ATN )是基于国际标准公共接口服务和协议,集成地面、地空和航空等多种数据子网,以实现统一数据传输服务的全球空地一体化航空专用通信网络。ATN最大的转变是从面向字符传输到面向比特传输,是未来实现航空大数据实时分析的基础通信保障。ATN主要由通信子网、ATN路由器和终端系统组成。其中ATN通信子网一般由机上子网、空地子网(如甚高频地空数据链、二次雷达S模式、 卫星通信、高频地空数据链等)和地面子网三种形式的数据通信网络组成。而ATN异质网际间的数据传输,则由ATN路由器实现。cda数据分析师培训
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据分析、业务监控、运营复盘等场景中,列值趋势计算是核心需求之一。无论是分析销售额的月度增长、用户活跃的变化趋势、库存 ...
2026-06-12在数字经济深度渗透的当下,消费者的购买行为已从过去的 “被动接受” 转变为 “主动决策”。流量红利消退、获客成本攀升、用户 ...
2026-06-12CDA三级认证是三个级别中的塔尖,全面考察数据战略、团队领导和复杂项目的综合能力。它所对应的《敏捷数据挖掘》教材,不再局限 ...
2026-06-12在游戏产业的商业逻辑中,付费玩家是支撑游戏生存与发展的核心支柱。行业普遍遵循 “二八定律”:20% 的付费玩家贡献了游戏 80% ...
2026-06-11【核心关键词】企业、定位、传统、产品、互联网、可视化、业务侧、数字化、结构化、数据分析、传统制造业、市场状态、发展空间 ...
2026-06-11 解读《CDA二级教材:量化策略分析(2025)》的全景结构与学习逻辑 ” CDA二级认证是企业招聘数据分析师时最常提及的证书门槛 ...
2026-06-11【核心关键词】药企、可视化、营销、分类、数据分析师、销售数据、业务人员、指导方向、分析报告、营销数据、营销医生 【专访摘 ...
2026-06-10在统计学分析、问卷调研、实验验证、业务复盘等场景中,卡方检验与 T 检验是应用最广泛的两类基础假设检验方法。前者专门处理分 ...
2026-06-10 很多数据分析师每天都在计算指标、制作报表,但当被问到“什么叫指标数据元”“指标数据标准包含哪些核心维度”“指标数据质 ...
2026-06-10在MySQL数据库日常查询、数据统计、后台接口开发、数据导出等场景中,开发者经常需要查询数据表除某几列之外的所有字段。例如查 ...
2026-06-09在Python网络请求、爬虫开发、接口测试、数据抓取等实操场景中,requests库是最常用的第三方请求工具,而content属性是requests ...
2026-06-09 数据分析正在重塑每一个行业。CDA认证的三本官方教材,分别对应Level I、Level II、Level III,为你铺就从业务数据分析到数 ...
2026-06-09在数字财务、智慧财税、业财融合深度推进的当下,传统财务模式下数据标准混乱、业务流程碎片化、知识无法沉淀、系统互通性差等问 ...
2026-06-08随着数字经济深度渗透各行各业,数据正式成为继土地、劳动力、资本、技术之后的第五大生产要素,是企业数字化转型、精细化运营、 ...
2026-06-08 很多数据分析师能熟练写SQL、做透视表,但当被问到“数据是从哪里来的?经过哪些加工才进入数据仓库?ETL具体做了什么?”时 ...
2026-06-08【核心关键词】贷款、报表、课程、专业、建模、缺失值、营销、互联网、银行、办公自动化、数据分析、数据预处理、特征工程、贷 ...
2026-06-05在数据库数据查询、业务报表统计、多表关联分析中,LEFT JOIN左连接是使用率最高的SQL关联查询语句。其核心特性是保留左表全部数 ...
2026-06-05 很多数据分析师能熟练地写SQL、做透视表、算描述性统计,但当被问到“如何预测用户流失概率”“如何归因销量下滑的关键因素 ...
2026-06-05任何一款产品从诞生、普及到最终退出市场,都会遵循一套固定的发展规律,这就是产品生命周期理论。在市场竞争日益激烈、产品迭代 ...
2026-06-04在Excel数据分析、办公统计、业务报表制作场景中,数据透视表是数据汇总、分类统计、快速复盘的核心工具,能够高效完成海量原始 ...
2026-06-04