京公网安备 11010802034615号
经营许可证编号:京B2-20210330
主数据与大数据的结合才能提升数据效益
当越来越多的企业采用大数据技术、云计算以及社交媒体来发现客户需求、拓展业务时,他们需要主数据管理(MDM)来追随这些大趋势,从数据中萃取更大的业务价值,进而优化品牌管理,拓展市场新渠道,打造企业核心竞争力。行之有效的主数据管理不仅能够提升企业的数据质量,更可以和大数据技术紧密结合。
主数据是企业核心业务实体
主数据是企业运营中担当着关键角色的核心业务实体,它们是系统间的共享数据(例如客户、产品、供应商、账户和组织部门相关数据),分散地存在于企业的各业务系统中,也是企业内部能够跨业务、跨系统重复使用的高价值数据。需要注意的是,主数据并不是企业内所有的业务数据,而是有必要在各个系统间共享的数据才是主数据。比如大部分的交易数据、账单数据等都不是主数据。涵盖资源、产品、事件、客户、财务、账户、员工、合作伙伴等,用于描述核心业务实体的数据才是主数据。因此,对主数据的识别,要把握主数据作为业务运作核心的本质。
其实,在没有建主数据系统的时候,主数据就早已存在,只是它存在的形式和存在的地点是不合理的。主数据管理可以帮助企业从分散的业务系统中整合最核心的、最需要共享的数据,对这些不同来源、不同格式的数据进行集中清洗和匹配,然后以服务的方式把统一的、完整的、准确的、具有共识性的主数据,分发给全企业范围内需要使用这些数据的系统或应用。
企业做主数据管理最主要的就是要解决主数据在各系统之间的一致性问题,让企业拥有统一的主数据访问接口,拥有集中的且内容丰富和干净的数据中心,能够为各业务部门提供一致、完整的共享信息平台,为业务流程和经营决策提供了一个可靠的支撑载体。当然,主数据管理也可以作为一个企业的数据标准,强化对各业务系统的共性数据实体和模型的管理,避免出现大的业务概念不一致,降低应用孤岛、数据孤岛出现的几率,从根本上保证系统之间能实现数据的较好共享,增强了各系统在企业层面的互动,从而提高企业运营效益,提高数据质量,更好地为企业信息集成做好铺垫。
如果从产品角度来谈主数据,更多是如何去实现产品的创新。我们以制造企业为例,他们会因一个产品从研发、生产到市场销售各个阶段命名不一致,造成整个产品信息的不一致。这时候,从管理角度、从产品快速上市角度都会带来很大的混淆,所以必须确保产品从整个生命周期保持它的信息一致性。同时,也使构建新产品的时候更有针对性,清楚哪些市场空白可以填补,哪些可以衍生出新产品,这对于整个企业的运作都有依据价值。
主数据与大数据相得益彰
主数据和大数据的核心都是数据,但它们的关注角度有所不同:大数据关注于数据的量和数据的类型,而主数据则更关注于数据的质量。主数据和大数据的范畴也不是一成不变的,比如在微博上说的一句话是大数据范畴,这种社交类信息一般不会纳入到主数据中,但也有可能随着时间的推移、技术的进步以及成本的降低,在不久后归入到主数据范畴内。
主数据侧重于数据的组织,而大数据则提供了更多的原材料。举个例子,现在不管是产品销售还是服务推广,都强调的一个前提是以客户为中心,保险公司若要推销一种保单,会关注客户和潜在客户在这个保单群里的言论,这些都是大数据,而具体到究竟是哪个客户发表的言论则属于主数据的范畴。所以说,企业要获得更好数据应用效果和价值,应以主数据为中心、为筋脉,通过主数据把各类散乱的大数据有效串联起来。同时,大数据也是主数据的一个重要补充,两者的结合可以达到很好的效果。
主数据平台就像一个八爪鱼,它以主数据为中心,跟各个内、外部系统建立联系。主数据管理不仅要整合业务系统中高价值数据,还要将外围更广泛的数据整合到主数据周围来。大数据常以非结构化形式存在,甚至不在企业内部,那么如何去结合呢?Informatica大中国区首席产品顾问但彬认为,企业需要一套产品使企业能够利用高效、低成本的计算架构实现:在大数据中快速解决个体识别问题,比如客户识别;在数据集分区不可行的情况下,高效完成大批量数据,避免重复化;以更佳的成本效益方式加强社交媒体分析,并将碎片化的个体拼接为完整的个体,以实现有实际意义的交互分析。
现在,人们不用把照片和视频之类的大数据拿到主数据平台上,通过两个系统的整合依然知道在哪里能找到这个客户相关的视频信息,这种系统集成的需求会越来越广泛。与以往传统的只是集成企业最核心系统不同,会慢慢膨胀得越来越大,内容越来越丰富,而且系统之间整合的形式也趋于多样化,这也是近年来新的发展趋势。提升企业数据的整合和管理能力,将数据集成扩展到社交媒体数据、网络日志、传感器设备数据、文档、电子邮件、其他无编码格式的多结构化或非结构化数据,能够显著减少浪费在垃圾资料的时间,有效降低大数据开发、维护成本。
主数据管理是一个持续建设的过程
虽然企业清楚主数据的价值,但往往不知从何下手,如何实施。经常有客户手中有一笔钱会突然提出要做主数据,希望上线一套主数据管理系统,但却只给一个月的项目实施时间。可以说,这是一个非常不合理的时间安排,一个月可能对客户需求都了解不透彻,更别提设计平台,以及平台与各业务系统的整合问题。
企业采用主数据方案最重要的不是技术准备,而是业务准备,企业在上马主数据项目时,首先要想清楚项目所要达到的目的、目标和愿景,能给企业的业务带来什么好处。在拥有业务驱动力后,企业要做的第二件事就是明确自己的痛点,因为主数据问题很难一次性解决,要有优先级,分期分批地执行。最后,则考虑必须做哪些具体的任务,如何实现主数据管理。
主数据问题很难一次性解决,因而造成项目复杂度高、工期长、耗费大的问题,建设前期对于企业来说感知不明显,容易遭到质疑。因此建议企业采取渐进的方式来建设,先基础、后深化,先局部、后覆盖,这样让企业逐步感受到主数据带来的益处。第一期项目可以从小规模入手(比如选择一个业务领域),一个业务领域成功会带动更多业务领域参与,前期的成功会成为后续实施的推升动力。
为保证企业能够有条不紊地实施项目,建议企业根据规划方法论,分阶段、分步骤开展工作。但彬告诉记者,目前Informatica MDM产品解决方案把主数据生命周期划分为9个阶段:访、发现、建模、清洗、识别、解决、关联、治理以及交付。而且这是一个循环往复的过程,当有新的主数据出现或经过几大阶段治理后的主数据仍未达到质量要求时,主数据管理都会进入下一轮循环。数据治理的过程贯穿于整个生命周期,体现了主数据对于数据质量的管控作用。
越来越多中国企业的CIO们也已经看到了主数据管理平台为企业带来的管理效率的提升、运营风险的降低以及节省IT成本等效益,并将其逐渐提上企业信息化建设的日程。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在统计学分析、实验研究、业务数据复盘过程中,单因素方差分析是检验自变量对因变量是否存在显著影响的核心方法。其中,两个水平 ...
2026-05-26【核心关键词】算法、客户、大数据、互联网、调优、建模、模型优化、机器学习、评分卡模型、模型开发、智能风控、业务场景、数 ...
2026-05-26 很多数据分析师写过无数个 SELECT,但当被问到“新建一张表,该如何定义字段类型来保证数据质量”“创建视图和存储物理表有 ...
2026-05-26在数据清洗、统计分析与数据质量检测工作中,箱型图(又称箱线图、Box Plot)是最直观、最高效的可视化分析工具之一。相较于柱状 ...
2026-05-25在大数据分析、数据清洗、质量管控、风险监测等领域,异常数据识别是保障数据质量、确保分析结论精准、规避业务决策失误的核心基 ...
2026-05-25 很多数据分析师精通Excel函数和透视表,但当被问到“数据从哪里来”“表和视图有什么区别”“数据库管理系统和SQL是什么关系 ...
2026-05-25数字化经营时代,企业的市场竞争早已从经验决策转向数据决策。门店营收、用户转化、产品销量、成本损耗、存量资产等所有经营行为 ...
2026-05-22在MySQL数据库日常运维、业务数据校验、数据迁移与数据清洗场景中,自增主键ID的连续性校验是一项基础且关键的工作。MySQL的Auto ...
2026-05-22 很多企业团队并非缺乏指标,而是陷入“指标失控”:仪表盘上堆满实时跳动的数据,却无法回答“当前瓶颈在哪、下一步该做什么 ...
2026-05-22【核心关键词】大数据、可视化、存储、架构、客户、离线、产品、同步、实时、数据仓库、数据分析、数据可视化、存储数据、离线 ...
2026-05-21在电商流量红利消退、公域获客成本持续走高的当下,存量用户深度挖掘已成为店铺增收增效的核心抓手。相较于付费投放获取的陌生新 ...
2026-05-21 很多数据分析师每天盯着几十个指标,但当被问到“这套指标要支撑什么业务目标”“指标之间是什么逻辑关系”“业务变化时如何 ...
2026-05-21在数据驱动决策的时代,数据质量直接决定分析结果的可靠性与准确性,而异常值作为数据清洗中的核心痛点,往往会扭曲分析结论、误 ...
2026-05-20 很多数据分析师每天盯着GMV、DAU、转化率,但当被问到“哪些指标在所有行业都适用”“哪些指标只对电商有意义”“二者如何搭 ...
2026-05-20Agent的能力边界,很大程度上取决于其掌握的Skill质量和数量。传统做法是靠人工编写和维护Skill,但这条路很快会遇到瓶颈。业务 ...
2026-05-20在统计分析中,方差分析(ANOVA)是一种常用的假设检验方法,核心用于分析“一个或多个自变量对单个因变量的影响”,广泛应用于 ...
2026-05-19 很多数据分析师每天盯着GMV、DAU、转化率,但当被问到“什么是指标”“指标和维度有什么区别”“如何定义指标值的计算规则和 ...
2026-05-19想高效备考 CDA 一级,拒绝盲目刷题、冗余学习?《CDA 一级教材知识手册》重磅来袭!以官方教材为核心,浓缩 13 章 103 个核心考 ...
2026-05-19在数据统计分析中,卡方检验是一种常用的非参数检验方法,核心用于判断两个或多个分类变量之间是否存在显著关联,广泛应用于市场 ...
2026-05-18在企业数字化转型的浪潮中,很多企业陷入了“技术堆砌”的误区——上线了ERP、CRM、BI等各类系统,积累了海量数据,却依然面临“ ...
2026-05-18