京公网安备 11010802034615号
经营许可证编号:京B2-20210330
我们知道,世界上唯一不变的就是变化本身,因此变革管理是商业永恒的话题。
变革管理的两个重要工具便是数据资产管理和精益流程管理。
前者使得机构“知炎凉,知利害“,后者使得机构明白自身特点,做到上令下达,这里我们只说前者。“知炎凉“是一个下情上传的过程,从业务数据采集到数据挖掘模型实现洞察,为组织的决策机构提供制定策略的依据。比如在根据客户提供的信息预测出如果赊销或授予贷款后违约的可能性。”知利害“是组织中各级管理者分析决策过程,经常需要结合各种报表和可视化工具进行决策支持。报表体系是对最终经营指标的逐级拆分,比如著名的杜邦财务分析体系,将制造业企业的资产收益率这个最终企业价值衡量指标拆解为由收入、成本和周转率组成的业务部门可操纵的KPI指标。又比如,在信贷业务中,将产品利润率拆分为贷款利率、获客成本率、审批通过率、不良率等。最低层次的指标,比如不良率指标,可以通过上面提到的数据挖掘模型对每个申请者未来的不良率进行预测。
策略制定者根据每个潜在贷款用户的不良率的预测值,以产品总的利润率最大化为目标,对申请者进行取舍。说到这里,读者就明白了数据人的两个基本工作,那就是制作汇报报表和建立数据挖掘模型。如下图所示,左侧的任务是对接各数据源,根据业务部门认可的标准,核定数据质量和含义,根据计算方法制作报表,供决策人员使用;右侧的任务是对每个用户、产品和渠道打标签,在业务主题之下建立算法模型并根据每个个体的预测值过滤名单,并在决策引擎中配置相应的业务执行策略,实现信贷审批或精准营销自动化,最后还有评价阈值选取和策略的执行效果,作为下一步优化的依据。
以上说的应用点比较抽象,下面列举一下数据挖掘的常见业务场景。
客户智能主要是基于对客户的洞察,以实现客户全生命周期价值提升为目的的分析场景。比如在初次获客时识别高价值客户,并进行重点营销,提高单客价值。这里的风险智能指的是狭义的信贷风险,主要是指授信业务前识别出申请者的还款意愿、还款能力和真实意图,降低违约成本。财务智能则是关注机构资金的运行效率和流动性安全,需要对宏观和行业指标进行精确预测,合理分配资金资源,降低无效配置成本。运营智能可以识别并发现不合理事件,降低操作风险的成本。
数据资产在为企业提供价值的时候,会遇到很多问题,主要表现为以下三点:
1)部门各自为政,数据反复清洗加工、分析工具重复采购、挖掘成果小范围使用、先进经验未能共享;
2)数据割裂:管理条线间数据割裂、数据来源间未能打通、数据脱敏后丧失价值,比如我们在做洗钱交易识别时发现交易对手的唯一标示全部是星号,这就是选取了错误的脱敏方式导致的不可恢复的错误后果;
3)缺乏系统性管理:缺乏全面的围绕客户、风险、运营、财务等全面规划分析场景,执行过程随意,流程体系不健全,保障不到位,数据和模型资产流失严重。
数据治理便是为数据资产保值增值而服务的。
其目标是消除歧义、减少数据孤岛,降低数据使用成本,提高对业务的响应,提高对数据隐私安全保护。
实施数据治理可以为数据管理提供可信任的数据,减少数据重复,增强业务和IT对于数据的信心,改善数据的及时性和可用性,建立通用的数据词汇表,以确保访问正确的信息,定义企业范围(或站点/项目范围)的值以获取公共参考数据,提供信息和指导,以协助有关数据的合规性和监管工作。
过去提到数据治理,更多的被认为是IT部门的事,其实不是这样的。就拿数据质量举例吧,数据来自业务,它产生于业务,获取自业务系统,数据质量标准也是业务部门订的,数据人只是帮业务人员落地质量检验,但是数据有质量问题,是不能直接解决的。业务部门如果不太关心数据质量,比如说最近金融监管部门对洗钱行为监管更严格了,很多银行希望买套系统或者寄希望于AI算法识别洗钱行为,但是很多金融机构对最基本客户信息还不了解,连客户基本的联系方式和地址都存在大量缺失,这很难保证客户的真实性。
举个例子,一间屋里注册了六家公司,这些公司肯定是空壳公司。数据质量如果由IT负责很难满足要求,因为业务人员办理业务的时候根本不去核实这个地址的真实性,地址写不写他都不太关心。把数据质量提升的工作压到IT人员根本解决不了问题。
数据治理在国外自上世纪80年代应企业自身数据资产管理诉求而内生发展起来。我们企业最早于2003年提出数据治理概念,之后银行业应监管要求,自2005年逐步加强对数据治理的重视和投资力度。取得了丰硕的成果,但是往往带有“运动”的特征。一提到数据治理,更多的是关注自顶向下的制度设计,而忽视自底向上业务的驱动。很多时候是IT闭门造车,还提出基于IT架构的数据治理。
感觉这很专业啊,但是我举个例子,比如我今天想吃饭了,得看看家里有什么菜,至于符不符合口味不知道,有什么就吃什么。
这是基于IT架构的数据治理,只管盘点现有系统和现有数据。这个方法确实有其用处,但是不应该作为数据治理的主导。因此,以往的数据治理经常出现有数据治理组织架构,却无合适的人到岗;有数据标准等规章制度,而在新旧系统上无法落地。
因此,ThoughtWorks数据智能事业部呼吁国内企业回到价值导向的数据治理的初心,提出精益数据治理,不仅从上至下,并且自底向上,围绕业务场景,以价值驱动数据治理的具体体现。
精益数据治理讲求价值驱动,围绕场景,减少浪费,持续改进。体现为以下五个特点:
1)从业务愿景出发识别价值,在适当的时间为内部客户提供价值是精益数据治理的关键要求,通过对齐业务战略和目标来识别有价值的数据利用场景。
2)构建价值流,识别出场景后,在源数据和场景之间建立价值流,价值流是将产品或服务带给用户所需的资源和信息流,需要构建和改进价值流,避免浪费。
3)使价值从源头流向用户,“流”使价值能够以经过最少的阶段和活动便能交付,无缝流是精益数据治理的关键要求。减少浪费是精益数据治理的重要策略,我们发现,所有的数据质量的问题,都能够与精益思想的7种浪费一一对应起来,解决了数据生产的浪费问题,就大部分解决了数据质量问题。
4)拉动价值流,只有在内部客户有需求时,流程才能运行,此阶段强调仅在有需求时才需要响应。
5)不断迭代,精益求精,持续改进以追求完善,实现可持续变革。
ThoughtWorks数据智能事业部根据多年辅导企业数字化转型的实践,推出价值导向的数据治理实施路径。其有三点异于传统数据治理实施路径:
1)以数据探查代替需求访谈。
精益数据治理是以在数据应用为纲,但是在数据治理初期,企业管理人员对数据应用的价值认识是模糊的,有些只是一些想法,往往难以指导数据应用规划的制定。因此我们借用敏捷开发的工具,创造出精益数据探索工作坊,帮助企业构建数据驱动的创新战略,发现数据创新场景,验证和制定数据应用创新计划;
2)IT部门数据中台敏捷开发。
以往数据治理往往分为咨询、落地等多个阶段,并且把数据标准落地、质量监控这些重要任务留给甲方自行完成。根据我们的观察,数据标准落地部门往往缺乏新IT系统上线评审的话语权,导致有标准无法落、无人落、无力落的尴尬局面。数据治理平台的快速建设是治理制度落地的有力保障,实现端到端的快速落地,体现治理成果;
3)业务部门开展数据赋能,能力提升大比拼,以“用”促”治”,。
数据资产管理讲求“看选用治评”,其中“选”是难点。业务人员从拍脑袋做事到用数据说话,这是一个能力和意愿的组合问题。因此我们在数据治理同期提供数据分析人才培训(含认证)和内部项目实训,解决分析能力短缺和实际项目经验匮乏问题,并且结合内部数据分析项目评优,激发业务人员用数据的热情。解决数字化赋能过程中数据人才选拔缺标准、难动员、分工不明的问题,得到一举多得的功效。避免数据治理业务效果不明确时一开始自上而下命令导致业务部门的消极态度,IT部门自说自话、数据治理团队脱离业务运转的尴尬状况出现。
数据资管出品
作者:研究猿
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据分析、机器学习的实操场景中,聚类分析与主成分分析(PCA)是两种高频使用的统计与数据处理方法。二者常被用于数据预处理 ...
2026-02-24在聚类分析的实操场景中,K-Means算法因其简单高效、易落地的特点,成为处理无监督分类问题的首选工具——无论是用户画像分层、 ...
2026-02-24数字化浪潮下,数据已成为企业核心竞争力,“用数据说话、用数据决策”成为企业发展的核心逻辑。CDA(Certified Data Analyst) ...
2026-02-24CDA一级知识点汇总手册 第五章 业务数据的特征、处理与透视分析考点52:业务数据分析基础考点53:输入和资源需求考点54:业务数 ...
2026-02-23CDA一级知识点汇总手册 第四章 战略与业务数据分析考点43:战略数据分析基础考点44:表格结构数据的使用考点45:输入数据和资源 ...
2026-02-22CDA一级知识点汇总手册 第三章 商业数据分析框架考点27:商业数据分析体系的核心逻辑——BSC五视角框架考点28:战略视角考点29: ...
2026-02-20CDA一级知识点汇总手册 第二章 数据分析方法考点7:基础范式的核心逻辑(本体论与流程化)考点8:分类分析(本体论核心应用)考 ...
2026-02-18第一章:数据分析思维考点1:UVCA时代的特点考点2:数据分析背后的逻辑思维方法论考点3:流程化企业的数据分析需求考点4:企业数 ...
2026-02-16在数据分析、业务决策、科学研究等领域,统计模型是连接原始数据与业务价值的核心工具——它通过对数据的规律提炼、变量关联分析 ...
2026-02-14在SQL查询实操中,SELECT * 与 SELECT 字段1, 字段2,...(指定个别字段)是最常用的两种查询方式。很多开发者在日常开发中,为了 ...
2026-02-14对CDA(Certified Data Analyst)数据分析师而言,数据分析的核心不是孤立解读单个指标数值,而是构建一套科学、完整、贴合业务 ...
2026-02-14在Power BI实操中,函数是实现数据清洗、建模计算、可视化呈现的核心工具——无论是简单的数据筛选、异常值处理,还是复杂的度量 ...
2026-02-13在互联网运营、产品迭代、用户增长等工作中,“留存率”是衡量产品核心价值、用户粘性的核心指标——而次日留存率,作为留存率体 ...
2026-02-13对CDA(Certified Data Analyst)数据分析师而言,指标是贯穿工作全流程的核心载体,更是连接原始数据与业务洞察的关键桥梁。CDA ...
2026-02-13在机器学习建模实操中,“特征选择”是提升模型性能、简化模型复杂度、解读数据逻辑的核心步骤——而随机森林(Random Forest) ...
2026-02-12在MySQL数据查询实操中,按日期分组统计是高频需求——比如统计每日用户登录量、每日订单量、每日销售额,需要按日期分组展示, ...
2026-02-12对CDA(Certified Data Analyst)数据分析师而言,描述性统计是贯穿实操全流程的核心基础,更是从“原始数据”到“初步洞察”的 ...
2026-02-12备考CDA的小伙伴,专属宠粉福利来啦! 不用拼运气抽奖,不用复杂操作,只要转发CDA真题海报到朋友圈集赞,就能免费抱走实用好礼 ...
2026-02-11在数据科学、机器学习实操中,Anaconda是必备工具——它集成了Python解释器、conda包管理器,能快速搭建独立的虚拟环境,便捷安 ...
2026-02-11在Tableau数据可视化实操中,多表连接是高频操作——无论是将“产品表”与“销量表”连接分析产品销量,还是将“用户表”与“消 ...
2026-02-11