京公网安备 11010802034615号
经营许可证编号:京B2-20210330
我们知道,世界上唯一不变的就是变化本身,因此变革管理是商业永恒的话题。
变革管理的两个重要工具便是数据资产管理和精益流程管理。
前者使得机构“知炎凉,知利害“,后者使得机构明白自身特点,做到上令下达,这里我们只说前者。“知炎凉“是一个下情上传的过程,从业务数据采集到数据挖掘模型实现洞察,为组织的决策机构提供制定策略的依据。比如在根据客户提供的信息预测出如果赊销或授予贷款后违约的可能性。”知利害“是组织中各级管理者分析决策过程,经常需要结合各种报表和可视化工具进行决策支持。报表体系是对最终经营指标的逐级拆分,比如著名的杜邦财务分析体系,将制造业企业的资产收益率这个最终企业价值衡量指标拆解为由收入、成本和周转率组成的业务部门可操纵的KPI指标。又比如,在信贷业务中,将产品利润率拆分为贷款利率、获客成本率、审批通过率、不良率等。最低层次的指标,比如不良率指标,可以通过上面提到的数据挖掘模型对每个申请者未来的不良率进行预测。
策略制定者根据每个潜在贷款用户的不良率的预测值,以产品总的利润率最大化为目标,对申请者进行取舍。说到这里,读者就明白了数据人的两个基本工作,那就是制作汇报报表和建立数据挖掘模型。如下图所示,左侧的任务是对接各数据源,根据业务部门认可的标准,核定数据质量和含义,根据计算方法制作报表,供决策人员使用;右侧的任务是对每个用户、产品和渠道打标签,在业务主题之下建立算法模型并根据每个个体的预测值过滤名单,并在决策引擎中配置相应的业务执行策略,实现信贷审批或精准营销自动化,最后还有评价阈值选取和策略的执行效果,作为下一步优化的依据。
以上说的应用点比较抽象,下面列举一下数据挖掘的常见业务场景。
客户智能主要是基于对客户的洞察,以实现客户全生命周期价值提升为目的的分析场景。比如在初次获客时识别高价值客户,并进行重点营销,提高单客价值。这里的风险智能指的是狭义的信贷风险,主要是指授信业务前识别出申请者的还款意愿、还款能力和真实意图,降低违约成本。财务智能则是关注机构资金的运行效率和流动性安全,需要对宏观和行业指标进行精确预测,合理分配资金资源,降低无效配置成本。运营智能可以识别并发现不合理事件,降低操作风险的成本。
数据资产在为企业提供价值的时候,会遇到很多问题,主要表现为以下三点:
1)部门各自为政,数据反复清洗加工、分析工具重复采购、挖掘成果小范围使用、先进经验未能共享;
2)数据割裂:管理条线间数据割裂、数据来源间未能打通、数据脱敏后丧失价值,比如我们在做洗钱交易识别时发现交易对手的唯一标示全部是星号,这就是选取了错误的脱敏方式导致的不可恢复的错误后果;
3)缺乏系统性管理:缺乏全面的围绕客户、风险、运营、财务等全面规划分析场景,执行过程随意,流程体系不健全,保障不到位,数据和模型资产流失严重。
数据治理便是为数据资产保值增值而服务的。
其目标是消除歧义、减少数据孤岛,降低数据使用成本,提高对业务的响应,提高对数据隐私安全保护。
实施数据治理可以为数据管理提供可信任的数据,减少数据重复,增强业务和IT对于数据的信心,改善数据的及时性和可用性,建立通用的数据词汇表,以确保访问正确的信息,定义企业范围(或站点/项目范围)的值以获取公共参考数据,提供信息和指导,以协助有关数据的合规性和监管工作。
过去提到数据治理,更多的被认为是IT部门的事,其实不是这样的。就拿数据质量举例吧,数据来自业务,它产生于业务,获取自业务系统,数据质量标准也是业务部门订的,数据人只是帮业务人员落地质量检验,但是数据有质量问题,是不能直接解决的。业务部门如果不太关心数据质量,比如说最近金融监管部门对洗钱行为监管更严格了,很多银行希望买套系统或者寄希望于AI算法识别洗钱行为,但是很多金融机构对最基本客户信息还不了解,连客户基本的联系方式和地址都存在大量缺失,这很难保证客户的真实性。
举个例子,一间屋里注册了六家公司,这些公司肯定是空壳公司。数据质量如果由IT负责很难满足要求,因为业务人员办理业务的时候根本不去核实这个地址的真实性,地址写不写他都不太关心。把数据质量提升的工作压到IT人员根本解决不了问题。
数据治理在国外自上世纪80年代应企业自身数据资产管理诉求而内生发展起来。我们企业最早于2003年提出数据治理概念,之后银行业应监管要求,自2005年逐步加强对数据治理的重视和投资力度。取得了丰硕的成果,但是往往带有“运动”的特征。一提到数据治理,更多的是关注自顶向下的制度设计,而忽视自底向上业务的驱动。很多时候是IT闭门造车,还提出基于IT架构的数据治理。
感觉这很专业啊,但是我举个例子,比如我今天想吃饭了,得看看家里有什么菜,至于符不符合口味不知道,有什么就吃什么。
这是基于IT架构的数据治理,只管盘点现有系统和现有数据。这个方法确实有其用处,但是不应该作为数据治理的主导。因此,以往的数据治理经常出现有数据治理组织架构,却无合适的人到岗;有数据标准等规章制度,而在新旧系统上无法落地。
因此,ThoughtWorks数据智能事业部呼吁国内企业回到价值导向的数据治理的初心,提出精益数据治理,不仅从上至下,并且自底向上,围绕业务场景,以价值驱动数据治理的具体体现。
精益数据治理讲求价值驱动,围绕场景,减少浪费,持续改进。体现为以下五个特点:
1)从业务愿景出发识别价值,在适当的时间为内部客户提供价值是精益数据治理的关键要求,通过对齐业务战略和目标来识别有价值的数据利用场景。
2)构建价值流,识别出场景后,在源数据和场景之间建立价值流,价值流是将产品或服务带给用户所需的资源和信息流,需要构建和改进价值流,避免浪费。
3)使价值从源头流向用户,“流”使价值能够以经过最少的阶段和活动便能交付,无缝流是精益数据治理的关键要求。减少浪费是精益数据治理的重要策略,我们发现,所有的数据质量的问题,都能够与精益思想的7种浪费一一对应起来,解决了数据生产的浪费问题,就大部分解决了数据质量问题。
4)拉动价值流,只有在内部客户有需求时,流程才能运行,此阶段强调仅在有需求时才需要响应。
5)不断迭代,精益求精,持续改进以追求完善,实现可持续变革。
ThoughtWorks数据智能事业部根据多年辅导企业数字化转型的实践,推出价值导向的数据治理实施路径。其有三点异于传统数据治理实施路径:
1)以数据探查代替需求访谈。
精益数据治理是以在数据应用为纲,但是在数据治理初期,企业管理人员对数据应用的价值认识是模糊的,有些只是一些想法,往往难以指导数据应用规划的制定。因此我们借用敏捷开发的工具,创造出精益数据探索工作坊,帮助企业构建数据驱动的创新战略,发现数据创新场景,验证和制定数据应用创新计划;
2)IT部门数据中台敏捷开发。
以往数据治理往往分为咨询、落地等多个阶段,并且把数据标准落地、质量监控这些重要任务留给甲方自行完成。根据我们的观察,数据标准落地部门往往缺乏新IT系统上线评审的话语权,导致有标准无法落、无人落、无力落的尴尬局面。数据治理平台的快速建设是治理制度落地的有力保障,实现端到端的快速落地,体现治理成果;
3)业务部门开展数据赋能,能力提升大比拼,以“用”促”治”,。
数据资产管理讲求“看选用治评”,其中“选”是难点。业务人员从拍脑袋做事到用数据说话,这是一个能力和意愿的组合问题。因此我们在数据治理同期提供数据分析人才培训(含认证)和内部项目实训,解决分析能力短缺和实际项目经验匮乏问题,并且结合内部数据分析项目评优,激发业务人员用数据的热情。解决数字化赋能过程中数据人才选拔缺标准、难动员、分工不明的问题,得到一举多得的功效。避免数据治理业务效果不明确时一开始自上而下命令导致业务部门的消极态度,IT部门自说自话、数据治理团队脱离业务运转的尴尬状况出现。
数据资管出品
作者:研究猿
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在休闲游戏的运营体系中,次日留存率是当之无愧的“生死线”——它不仅是衡量产品核心吸引力的首个关键指标,更直接决定了后续LT ...
2025-12-16在数字化转型浪潮中,“以用户为中心”已成为企业的核心经营理念,而用户画像则是企业洞察用户、精准决策的“核心工具”。然而, ...
2025-12-16在零售行业从“流量争夺”转向“价值深耕”的演进中,塔吉特百货(Target)以两场标志性实践树立了行业标杆——2000年后的孕妇精 ...
2025-12-15在统计学领域,二项分布与卡方检验是两个高频出现的概念,二者都常用于处理离散数据,因此常被初学者混淆。但本质上,二项分布是 ...
2025-12-15在CDA(Certified Data Analyst)数据分析师的工作链路中,“标签加工”是连接原始数据与业务应用的关键环节。企业积累的用户行 ...
2025-12-15在Python开发中,HTTP请求是与外部服务交互的核心场景——调用第三方API、对接微服务、爬取数据等都离不开它。虽然requests库已 ...
2025-12-12在数据驱动决策中,“数据波动大不大”是高频问题——零售店长关心日销售额是否稳定,工厂管理者关注产品尺寸偏差是否可控,基金 ...
2025-12-12在CDA(Certified Data Analyst)数据分析师的能力矩阵中,数据查询语言(SQL)是贯穿工作全流程的“核心工具”。无论是从数据库 ...
2025-12-12很多小伙伴都在问CDA考试的问题,以下是结合 2025 年最新政策与行业动态更新的 CDA 数据分析师认证考试 Q&A,覆盖考试内容、报考 ...
2025-12-11在Excel数据可视化中,柱形图因直观展示数据差异的优势被广泛使用,而背景色设置绝非简单的“换颜色”——合理的背景色能突出核 ...
2025-12-11在科研实验、商业分析或医学研究中,我们常需要判断“两组数据的差异是真实存在,还是偶然波动”——比如“新降压药的效果是否优 ...
2025-12-11在CDA(Certified Data Analyst)数据分析师的工作体系中,数据库就像“数据仓库的核心骨架”——所有业务数据的存储、组织与提 ...
2025-12-11在神经网络模型搭建中,“最后一层是否添加激活函数”是新手常困惑的关键问题——有人照搬中间层的ReLU激活,导致回归任务输出异 ...
2025-12-05在机器学习落地过程中,“模型准确率高但不可解释”“面对数据噪声就失效”是两大核心痛点——金融风控模型若无法解释决策依据, ...
2025-12-05在CDA(Certified Data Analyst)数据分析师的能力模型中,“指标计算”是基础技能,而“指标体系搭建”则是区分新手与资深分析 ...
2025-12-05在回归分析的结果解读中,R方(决定系数)是衡量模型拟合效果的核心指标——它代表因变量的变异中能被自变量解释的比例,取值通 ...
2025-12-04在城市规划、物流配送、文旅分析等场景中,经纬度热力图是解读空间数据的核心工具——它能将零散的GPS坐标(如外卖订单地址、景 ...
2025-12-04在CDA(Certified Data Analyst)数据分析师的指标体系中,“通用指标”与“场景指标”并非相互割裂的两个部分,而是支撑业务分 ...
2025-12-04每到“双十一”,电商平台的销售额会迎来爆发式增长;每逢冬季,北方的天然气消耗量会显著上升;每月的10号左右,工资发放会带动 ...
2025-12-03随着数字化转型的深入,企业面临的数据量呈指数级增长——电商的用户行为日志、物联网的传感器数据、社交平台的图文视频等,这些 ...
2025-12-03