京公网安备 11010802034615号
经营许可证编号:京B2-20210330
我们知道,世界上唯一不变的就是变化本身,因此变革管理是商业永恒的话题。
变革管理的两个重要工具便是数据资产管理和精益流程管理。
前者使得机构“知炎凉,知利害“,后者使得机构明白自身特点,做到上令下达,这里我们只说前者。“知炎凉“是一个下情上传的过程,从业务数据采集到数据挖掘模型实现洞察,为组织的决策机构提供制定策略的依据。比如在根据客户提供的信息预测出如果赊销或授予贷款后违约的可能性。”知利害“是组织中各级管理者分析决策过程,经常需要结合各种报表和可视化工具进行决策支持。报表体系是对最终经营指标的逐级拆分,比如著名的杜邦财务分析体系,将制造业企业的资产收益率这个最终企业价值衡量指标拆解为由收入、成本和周转率组成的业务部门可操纵的KPI指标。又比如,在信贷业务中,将产品利润率拆分为贷款利率、获客成本率、审批通过率、不良率等。最低层次的指标,比如不良率指标,可以通过上面提到的数据挖掘模型对每个申请者未来的不良率进行预测。
策略制定者根据每个潜在贷款用户的不良率的预测值,以产品总的利润率最大化为目标,对申请者进行取舍。说到这里,读者就明白了数据人的两个基本工作,那就是制作汇报报表和建立数据挖掘模型。如下图所示,左侧的任务是对接各数据源,根据业务部门认可的标准,核定数据质量和含义,根据计算方法制作报表,供决策人员使用;右侧的任务是对每个用户、产品和渠道打标签,在业务主题之下建立算法模型并根据每个个体的预测值过滤名单,并在决策引擎中配置相应的业务执行策略,实现信贷审批或精准营销自动化,最后还有评价阈值选取和策略的执行效果,作为下一步优化的依据。
以上说的应用点比较抽象,下面列举一下数据挖掘的常见业务场景。
客户智能主要是基于对客户的洞察,以实现客户全生命周期价值提升为目的的分析场景。比如在初次获客时识别高价值客户,并进行重点营销,提高单客价值。这里的风险智能指的是狭义的信贷风险,主要是指授信业务前识别出申请者的还款意愿、还款能力和真实意图,降低违约成本。财务智能则是关注机构资金的运行效率和流动性安全,需要对宏观和行业指标进行精确预测,合理分配资金资源,降低无效配置成本。运营智能可以识别并发现不合理事件,降低操作风险的成本。
数据资产在为企业提供价值的时候,会遇到很多问题,主要表现为以下三点:
1)部门各自为政,数据反复清洗加工、分析工具重复采购、挖掘成果小范围使用、先进经验未能共享;
2)数据割裂:管理条线间数据割裂、数据来源间未能打通、数据脱敏后丧失价值,比如我们在做洗钱交易识别时发现交易对手的唯一标示全部是星号,这就是选取了错误的脱敏方式导致的不可恢复的错误后果;
3)缺乏系统性管理:缺乏全面的围绕客户、风险、运营、财务等全面规划分析场景,执行过程随意,流程体系不健全,保障不到位,数据和模型资产流失严重。
数据治理便是为数据资产保值增值而服务的。
其目标是消除歧义、减少数据孤岛,降低数据使用成本,提高对业务的响应,提高对数据隐私安全保护。
实施数据治理可以为数据管理提供可信任的数据,减少数据重复,增强业务和IT对于数据的信心,改善数据的及时性和可用性,建立通用的数据词汇表,以确保访问正确的信息,定义企业范围(或站点/项目范围)的值以获取公共参考数据,提供信息和指导,以协助有关数据的合规性和监管工作。
过去提到数据治理,更多的被认为是IT部门的事,其实不是这样的。就拿数据质量举例吧,数据来自业务,它产生于业务,获取自业务系统,数据质量标准也是业务部门订的,数据人只是帮业务人员落地质量检验,但是数据有质量问题,是不能直接解决的。业务部门如果不太关心数据质量,比如说最近金融监管部门对洗钱行为监管更严格了,很多银行希望买套系统或者寄希望于AI算法识别洗钱行为,但是很多金融机构对最基本客户信息还不了解,连客户基本的联系方式和地址都存在大量缺失,这很难保证客户的真实性。
举个例子,一间屋里注册了六家公司,这些公司肯定是空壳公司。数据质量如果由IT负责很难满足要求,因为业务人员办理业务的时候根本不去核实这个地址的真实性,地址写不写他都不太关心。把数据质量提升的工作压到IT人员根本解决不了问题。
数据治理在国外自上世纪80年代应企业自身数据资产管理诉求而内生发展起来。我们企业最早于2003年提出数据治理概念,之后银行业应监管要求,自2005年逐步加强对数据治理的重视和投资力度。取得了丰硕的成果,但是往往带有“运动”的特征。一提到数据治理,更多的是关注自顶向下的制度设计,而忽视自底向上业务的驱动。很多时候是IT闭门造车,还提出基于IT架构的数据治理。
感觉这很专业啊,但是我举个例子,比如我今天想吃饭了,得看看家里有什么菜,至于符不符合口味不知道,有什么就吃什么。
这是基于IT架构的数据治理,只管盘点现有系统和现有数据。这个方法确实有其用处,但是不应该作为数据治理的主导。因此,以往的数据治理经常出现有数据治理组织架构,却无合适的人到岗;有数据标准等规章制度,而在新旧系统上无法落地。
因此,ThoughtWorks数据智能事业部呼吁国内企业回到价值导向的数据治理的初心,提出精益数据治理,不仅从上至下,并且自底向上,围绕业务场景,以价值驱动数据治理的具体体现。
精益数据治理讲求价值驱动,围绕场景,减少浪费,持续改进。体现为以下五个特点:
1)从业务愿景出发识别价值,在适当的时间为内部客户提供价值是精益数据治理的关键要求,通过对齐业务战略和目标来识别有价值的数据利用场景。
2)构建价值流,识别出场景后,在源数据和场景之间建立价值流,价值流是将产品或服务带给用户所需的资源和信息流,需要构建和改进价值流,避免浪费。
3)使价值从源头流向用户,“流”使价值能够以经过最少的阶段和活动便能交付,无缝流是精益数据治理的关键要求。减少浪费是精益数据治理的重要策略,我们发现,所有的数据质量的问题,都能够与精益思想的7种浪费一一对应起来,解决了数据生产的浪费问题,就大部分解决了数据质量问题。
4)拉动价值流,只有在内部客户有需求时,流程才能运行,此阶段强调仅在有需求时才需要响应。
5)不断迭代,精益求精,持续改进以追求完善,实现可持续变革。
ThoughtWorks数据智能事业部根据多年辅导企业数字化转型的实践,推出价值导向的数据治理实施路径。其有三点异于传统数据治理实施路径:
1)以数据探查代替需求访谈。
精益数据治理是以在数据应用为纲,但是在数据治理初期,企业管理人员对数据应用的价值认识是模糊的,有些只是一些想法,往往难以指导数据应用规划的制定。因此我们借用敏捷开发的工具,创造出精益数据探索工作坊,帮助企业构建数据驱动的创新战略,发现数据创新场景,验证和制定数据应用创新计划;
2)IT部门数据中台敏捷开发。
以往数据治理往往分为咨询、落地等多个阶段,并且把数据标准落地、质量监控这些重要任务留给甲方自行完成。根据我们的观察,数据标准落地部门往往缺乏新IT系统上线评审的话语权,导致有标准无法落、无人落、无力落的尴尬局面。数据治理平台的快速建设是治理制度落地的有力保障,实现端到端的快速落地,体现治理成果;
3)业务部门开展数据赋能,能力提升大比拼,以“用”促”治”,。
数据资产管理讲求“看选用治评”,其中“选”是难点。业务人员从拍脑袋做事到用数据说话,这是一个能力和意愿的组合问题。因此我们在数据治理同期提供数据分析人才培训(含认证)和内部项目实训,解决分析能力短缺和实际项目经验匮乏问题,并且结合内部数据分析项目评优,激发业务人员用数据的热情。解决数字化赋能过程中数据人才选拔缺标准、难动员、分工不明的问题,得到一举多得的功效。避免数据治理业务效果不明确时一开始自上而下命令导致业务部门的消极态度,IT部门自说自话、数据治理团队脱离业务运转的尴尬状况出现。
数据资管出品
作者:研究猿
CDA学员免费下载查看报告全文:2026全球数智化人才指数报告【CDA数据科学研究院】.pdf
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
用户调研是企业洞察客户需求、优化产品服务、制定运营策略的核心前提,而调研数据的可靠性,直接决定了决策的科学性与有效性。在 ...
2026-05-11在市场竞争日趋激烈、流量成本持续攀升的今天,企业的核心竞争力已从“获取流量”转向“挖掘客户价值”。客户作为企业最宝贵的资 ...
2026-05-11 很多数据分析师精通Excel单元格操作,熟练应用多种公式,但当被问到“表结构数据的基本处理单位是什么”“字段和记录的本质 ...
2026-05-11在互联网运营、产品优化、用户增长等领域,次日留存率是衡量产品价值、用户粘性与运营效果的核心指标,更是判断新用户是否认可产 ...
2026-05-09相关性分析是数据分析领域中用于探究两个或多个变量之间关联强度与方向的核心方法,广泛应用于科研探索、商业决策、医疗研究、社 ...
2026-05-09 数据分析师八成以上的时间在和数据表格打交道,但许多人拿到Excel后习惯性地先算、先分析,结果回头发现漏了一列关键数据, ...
2026-05-09在数据驱动运营的时代,指标是连接业务目标与实际行动的核心桥梁,是企业解读业务现状、发现问题、预判趋势的“量化标尺”。一套 ...
2026-05-08在存量竞争日趋激烈的商业时代,“以客户为中心”早已从口号落地为企业运营的核心逻辑。而客户画像作为打通“了解客户”与“服务 ...
2026-05-08 很多数据分析师每天与Excel打交道,但当被问到“什么是表格结构数据”“它和表结构数据有什么区别”“表格结构数据有哪些核 ...
2026-05-08在数据分析、计量研究等场景中,回归分析是探究变量间量化关系的核心方法,无论是简单的一元线性回归,还是复杂的多元线性回归、 ...
2026-05-07在数据分析、计量研究等场景中,回归分析是探究变量间量化关系的核心方法,无论是简单的一元线性回归,还是复杂的多元线性回归、 ...
2026-05-07 很多数据分析师画过趋势图、做过业绩预测,但当被问到“这个月销售额增长20%,到底是长期趋势自然增长,还是促销活动的短期 ...
2026-05-07在数字化时代,商业竞争的核心已从“经验驱动”转向“数据驱动”,越来越多的企业意识到,商业分析不是简单的数据统计与报表呈现 ...
2026-05-06在Excel数据透视表的实操中,“引用”是连接透视表与公式、辅助数据的核心操作,而相对引用作为最基础、最常用的引用方式,其设 ...
2026-05-06 很多数据分析师做过按月份的销售额趋势图,画过按天的流量折线图,但当被问到“时间序列和普通数据有什么本质区别”“季节性 ...
2026-05-06在Excel数据分析中,数据透视表是汇总、整理海量数据的高效工具,而公式则是实现数据二次计算、逻辑判断的核心功能。实际操作中 ...
2026-04-30Excel透视图是数据分析中不可或缺的工具,它能将透视表中的数据快速可视化,帮助我们直观捕捉数据规律、呈现分析结果。但在实际 ...
2026-04-30 很多数据分析师能熟练地计算指标、搭建标签体系,但当被问到“画像到底在解决什么问题”“画像和标签是什么关系”“画像如何 ...
2026-04-30在中介效应分析中,人口统计学变量(如年龄、性别、学历、收入、职业等)是常见的控制变量或调节变量,其处理方式直接影响分析结 ...
2026-04-29在SQL数据库实操中,日期数据的存储与显示是高频需求,而“数字日期”(如20240520、20241231、45321)是很多开发者、数据分析师 ...
2026-04-29