京公网安备 11010802034615号
经营许可证编号:京B2-20210330
主数据管理结合大数据 提升数据应用效益
当越来越多的企业采用大数据技术、云计算以及社交媒体来发现客户需求、拓展业务时,他们需要主数据管理(MDM)来追随这些大趋势,从数据中萃取更大的业务价值,进而优化品牌管理,拓展市场新渠道,打造企业核心竞争力。行之有效的主数据管理不仅能够提升企业的数据质量,更可以和大数据技术紧密结合。
主数据是企业核心业务实体
主数据是企业运营中担当着关键角色的核心业务实体,它们是系统间的共享数据(例如客户、产品、供应商、账户和组织部门相关数据),分散地存在于企业的各业务系统中,也是企业内部能够跨业务、跨系统重复使用的高价值数据。需要注意的是,主数据并不是企业内所有的业务数据,而是有必要在各个系统间共享的数据才是主数据。比如大部分的交易数据、账单数据等都不是主数据。涵盖资源、产品、事件、客户、财务、账户、员工、合作伙伴等,用于描述核心业务实体的数据才是主数据。因此,对主数据的识别,要把握主数据作为业务运作核心的本质。

其实,在没有建主数据系统的时候,主数据就早已存在,只是它存在的形式和存在的地点是不合理的。主数据管理可以帮助企业从分散的业务系统中整合最核心的、最需要共享的数据,对这些不同来源、不同格式的数据进行集中清洗和匹配,然后以服务的方式把统一的、完整的、准确的、具有共识性的主数据,分发给全企业范围内需要使用这些数据的系统或应用。
企业做主数据管理最主要的就是要解决主数据在各系统之间的一致性问题,让企业拥有统一的主数据访问接口,拥有集中的且内容丰富和干净的数据中心,能够为各业务部门提供一致、完整的共享信息平台,为业务流程和经营决策提供了一个可靠的支撑载体。当然,主数据管理也可以作为一个企业的数据标准,强化对各业务系统的共性数据实体和模型的管理,避免出现大的业务概念不一致,降低应用孤岛、数据孤岛出现的几率,从根本上保证系统之间能实现数据的较好共享,增强了各系统在企业层面的互动,从而提高企业运营效益,提高数据质量,更好地为企业信息集成做好铺垫。
如果从产品角度来谈主数据,更多是如何去实现产品的创新。我们以制造企业为例,他们会因一个产品从研发、生产到市场销售各个阶段命名不一致,造成整个产品信息的不一致。这时候,从管理角度、从产品快速上市角度都会带来很大的混淆,所以必须确保产品从整个生命周期保持它的信息一致性。同时,也使构建新产品的时候更有针对性,清楚哪些市场空白可以填补,哪些可以衍生出新产品,这对于整个企业的运作都有依据价值。
主数据与大数据相得益彰
主数据和大数据的核心都是数据,但它们的关注角度有所不同:大数据关注于数据的量和数据的类型,而主数据则更关注于数据的质量。主数据和大数据的范畴也不是一成不变的,比如在微博上说的一句话是大数据范畴,这种社交类信息一般不会纳入到主数据中,但也有可能随着时间的推移、技术的进步以及成本的降低,在不久后归入到主数据范畴内。
主数据侧重于数据的组织,而大数据则提供了更多的原材料。举个例子,现在不管是产品销售还是服务推广,都强调的一个前提是以客户为中心,保险公司若要推销一种保单,会关注客户和潜在客户在这个保单群里的言论,这些都是大数据,而具体到究竟是哪个客户发表的言论则属于主数据的范畴。所以说,企业要获得更好数据应用效果和价值,应以主数据为中心、为筋脉,通过主数据把各类散乱的大数据有效串联起来。同时,大数据也是主数据的一个重要补充,两者的结合可以达到很好的效果。
主数据平台就像一个八爪鱼,它以主数据为中心,跟各个内、外部系统建立联系。主数据管理不仅要整合业务系统中高价值数据,还要将外围更广泛的数据整合到主数据周围来。大数据常以非结构化形式存在,甚至不在企业内部,那么如何去结合呢?这恰恰体现了Informatica的价值,Informatica的能力就是数据整合。Informatica MDM 产品为大数据带来了主数据解决方案的全面支持,使企业能够利用高效、低成本的计算架构实现:在大数据中快速解决个体识别问题,比如客户识别;在数据集分区不可行的情况下,高效完成大批量数据,避免重复化;以更佳的成本效益方式加强社交媒体分析,并将碎片化的个体拼接为完整的个体,以实现有实际意义的交互分析。
现在,人们不用把照片和视频之类的大数据拿到主数据平台上,通过两个系统的整合依然知道在哪里能找到这个客户相关的视频信息,这种系统集成的需求会越来越广泛。与以往传统的只是集成企业最核心系统不同,会慢慢膨胀得越来越大,内容越来越丰富,而且系统之间整合的形式也趋于多样化,这也是近年来新的发展趋势。提升企业数据的整合和管理能力,将数据集成扩展到社交媒体数据、网络日志、传感器设备数据、文档、电子邮件、其他无编码格式的多结构化或非结构化数据,能够显著减少浪费在垃圾资料的时间,有效降低大数据开发、维护成本。Informatica正以不断的创新,持续加速MDM的增长和计划性,为企业用户迎接“集成化的大数据时代”做好准备。
主数据管理是一个持续建设的过程
虽然企业清楚主数据的价值,但往往不知从何下手,如何实施。经常有客户手中有一笔钱会突然提出要做主数据,希望上线一套主数据管理系统,但却只给一个月的项目实施时间。可以说,这是一个非常不合理的时间安排,一个月可能对客户需求都了解不透彻,更别提设计平台,以及平台与各业务系统的整合问题。
企业采用主数据方案最重要的不是技术准备,而是业务准备,企业在上马主数据项目时,首先要想清楚项目所要达到的目的、目标和愿景,能给企业的业务带来什么好处。在拥有业务驱动力后,企业要做的第二件事就是明确自己的痛点,因为主数据问题很难一次性解决,要有优先级,分期分批地执行。最后,则考虑必须做哪些具体的任务,如何实现主数据管理。
主数据问题很难一次性解决,因而造成项目复杂度高、工期长、耗费大的问题,建设前期对于企业来说感知不明显,容易遭到质疑。Informatica不希望客户花费了巨资却没有得到想要的结果,因此建议企业采取渐进的方式来建设,先基础、后深化,先局部、后覆盖,这样让企业逐步感受到主数据带来的益处。第一期项目可以从小规模入手(比如选择一个业务领域),一个业务领域成功会带动更多业务领域参与,前期的成功会成为后续实施的推升动力。
为保证企业能够有条不紊地实施项目,建议企业根据规划方法论,分阶段、分步骤开展工作。比如Informatica MDM产品解决方案,它把主数据生命周期划分为9个阶段:访、发现、建模、清洗、识别、解决、关联、治理以及交付。而且这是一个循环往复的过程,当有新的主数据出现或经过几大阶段治理后的主数据仍未达到质量要求时,主数据管理都会进入下一轮循环。数据治理的过程贯穿于整个生命周期,体现了主数据对于数据质量的管控作用。
目前世界各地的金融服务、生命科学、制造、医疗保健、政府等各行各业的很多大型企业都在利用 Informatica MDM解决方案来管理本地部署系统及云应用中的重复数据,从而提升运营效率、降低成本,并提升销售额。
越来越多中国企业的CIO们也已经看到了主数据管理平台为企业带来的管理效率的提升、运营风险的降低以及节省IT成本等效益,并将其逐渐提上企业信息化建设的日程。Informatica期望帮助他们实施的每一个主数据管理项目都可以成为一个成功的案例,客户成功才能促进软件厂商的成功,这是一个互赢的概念。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在回归分析的结果解读中,R方(决定系数)是衡量模型拟合效果的核心指标——它代表因变量的变异中能被自变量解释的比例,取值通 ...
2025-12-04在城市规划、物流配送、文旅分析等场景中,经纬度热力图是解读空间数据的核心工具——它能将零散的GPS坐标(如外卖订单地址、景 ...
2025-12-04在CDA(Certified Data Analyst)数据分析师的指标体系中,“通用指标”与“场景指标”并非相互割裂的两个部分,而是支撑业务分 ...
2025-12-04每到“双十一”,电商平台的销售额会迎来爆发式增长;每逢冬季,北方的天然气消耗量会显著上升;每月的10号左右,工资发放会带动 ...
2025-12-03随着数字化转型的深入,企业面临的数据量呈指数级增长——电商的用户行为日志、物联网的传感器数据、社交平台的图文视频等,这些 ...
2025-12-03在CDA(Certified Data Analyst)数据分析师的工作体系中,“指标”是贯穿始终的核心载体——从“销售额环比增长15%”的业务结论 ...
2025-12-03在神经网络训练中,损失函数的数值变化常被视为模型训练效果的“核心仪表盘”——初学者盯着屏幕上不断下降的损失值满心欢喜,却 ...
2025-12-02在CDA(Certified Data Analyst)数据分析师的日常工作中,“用部分数据推断整体情况”是高频需求——从10万条订单样本中判断全 ...
2025-12-02在数据预处理的纲量统一环节,标准化是消除量纲影响的核心手段——它将不同量级的特征(如“用户年龄”“消费金额”)转化为同一 ...
2025-12-02在数据驱动决策成为企业核心竞争力的今天,A/B测试已从“可选优化工具”升级为“必选验证体系”。它通过控制变量法构建“平行实 ...
2025-12-01在时间序列预测任务中,LSTM(长短期记忆网络)凭借对时序依赖关系的捕捉能力成为主流模型。但很多开发者在实操中会遇到困惑:用 ...
2025-12-01引言:数据时代的“透视镜”与“掘金者” 在数字经济浪潮下,数据已成为企业决策的核心资产,而CDA数据分析师正是挖掘数据价值的 ...
2025-12-01数据分析师的日常,常始于一堆“毫无章法”的数据点:电商后台导出的零散订单记录、APP埋点收集的无序用户行为日志、传感器实时 ...
2025-11-28在MySQL数据库运维中,“query end”是查询执行生命周期的收尾阶段,理论上耗时极短——主要完成结果集封装、资源释放、事务状态 ...
2025-11-28在CDA(Certified Data Analyst)数据分析师的工具包中,透视分析方法是处理表结构数据的“瑞士军刀”——无需复杂代码,仅通过 ...
2025-11-28在统计分析中,数据的分布形态是决定“用什么方法分析、信什么结果”的底层逻辑——它如同数据的“性格”,直接影响着描述统计的 ...
2025-11-27在电商订单查询、用户信息导出等业务场景中,技术人员常面临一个选择:是一次性查询500条数据,还是分5次每次查询100条?这个问 ...
2025-11-27对数据分析从业者和学生而言,表结构数据是最基础也最核心的分析载体——CRM系统的用户表、门店的销售明细表、仓库的库存表,都 ...
2025-11-27在业务数据可视化中,热力图(Heat Map)是传递“数据密度与分布特征”的核心工具——它通过颜色深浅直观呈现数据值的高低,让“ ...
2025-11-26在企业数字化转型中,业务数据分析师是连接数据与决策的核心纽带。但“数据分析师”并非单一角色,从初级到高级,其职责边界、能 ...
2025-11-26