京公网安备 11010802034615号
经营许可证编号:京B2-20210330
数据挖掘对客户进行深入分析
首先看一下数据挖掘在客户分析中的应用,数据挖掘主要应用于两大领域:客户智能和风险管理。客户智能分为数据层、挖掘层和营销层,数据挖掘属于中间这一层,是服务支撑层,为营销提供支持。数据挖掘传统的一些领域,包括客户细分、营销预测、产品关联、实时分析、客户提升、价值分析,以及现在随着大数据技术的兴起,我们会做实时分析,已经有些公司推出了基于文本的分析判断产品。
由于时间关系我主要介绍其中的几个,首先我们来看一下数据挖掘伴随着客户的生命周期是从始至终都存在的,拿信用卡业务来看,客户经历了从客户的捕获到客户的提升,到客户的成熟阶段,当然最后有可能发生客户的流失,完整的生命周期,不同的生命周期有不同的关注点。在下面,我们从数据挖掘的视角可以看到,其中有很多数据挖掘模型可以辅助业务的决策。其中黄色的是客户智能模型,黄色的是风险管理模型。
首先看客户细分,这是传统的客户细分,一般基于人口统计学的自然属性、银行交易信息、持有产品信息、互动反馈信息等等,针对这些进行细分,形成一个不是很深入的结果,可能会形成这样的用户分级。产生需要的,高价值低忠诚用户是蝴蝶,低价值高忠诚的用户是藤壶。最终细分出来的客户,可能是这个客户更深入洞察的角度,很巧跟邵钟飞也有相似的细分类型。所以,只有基于这些精准细分模型,才能给用户提供差异化的营销手段。
营销预测,举个简单例子,比如我有100个潜在客户,其中大概有25个人会对我的营销响应使用我的产品,并带来人均5元的收益。营销成本每人是1元,地毯式营销回报率是25%。在第二代的营销中我们可能会使用一些聚类的技术,营销的回报率可能能达到100%,这只是一个示例。第三代营销中我们可能会做双向预测模型,同时预测响应率和产品使用率,最终可能会收到比较好的效果,回报率要远远超出前两代。
来看流失分析,客户为什么会离开我们这家银行转移到其它银行?波士顿咨询公司做了一个市场调查,主要原因是服务质量不好,价格没有吸引力,产品没有吸引力,以及渠道的不方便因素,等等。同时有些市场调查认为,我获得一个新客户的成本是维持一个老客户成本的5倍,因此我们怎么样才能做好客户的流失分析,怎样才能留住客户?传统的客户流失分析是做事前的预测,以前不叫流失预测叫流失预警,这时你每个月都要想办法挽留这一大批用户,我们是不是要做一些事后分析?看看这些用户为什么会离开,提高自己的软技能和硬技能进行客户的挽留。
我们刚刚结束的一个项目案例,就是来做高端客户的流失分析。这个银行在2011-2012年这段时间的高端客户,流失率在18%左右的水平,同业的平均水平大概在12%左右,所以他认为他们的流失率偏高于同业其它银行。所以他想分析一下,第一,我流失的客户大概是什么样的构成情况,什么样的客户容易流失?第二,他们流失的原因是什么样的?第三,怎么预警挽留这些客户?这些客户中业务包括储蓄、理财、贷款,我们在做分析的时候,因为他不光要分析流失,他还要分析降级,他这里降级是指严重降级,AUM变动要超过两成。我们在里面分析的时候增加了一层,150万,这样让级与级之间的过度,大概一级就是损失150个AUM。
在做分析之前首先会有个思考,客户提供给我们这些基础数据涵盖了哪些内容,包括了人口统计学的属性,AUM的构成,借记卡的卡数、交易次数、交易金额等等这些信息,这和我做流失分析是有差距的,我缺乏一些流失相关的纬度,比如客户在我们银行主要是做什么业务的。客户在降级流失之前的一个月,最后保留的业务是什么。还有,客户降级流失的原因是因为他有消费需求吗?比如要付首付,还是因为更换银行?前两种我们认为:第一种,因为消费的需求,客户对你银行的忠诚度是没有降低的,他很有可能把这个银行作为接下来他首选的银行,提前还款这东西因为是个被动的业务比较特殊,如果只是单纯更换银行的话,这就说明客户对你的忠诚度有所降低。再有,无论是降级还是流失都是一个笼统的概念,客户的降级是短暂的,如果降了级又恢复,流失也有可能降到AUM的1%再恢复,还是有的客户销卡了?所以,要对客户有个全新的认识,当然这里面也认识到有些东西是数据之外的故事,比如这家银行某个月客户经理的流失率是比较高的,带来了客户流失率是比较高的。
首先我们增加了一个纬度,主要业务分类,这里面又分为月度主要业务分类,也就是计算每个月可以分为储蓄类、贷款类、理财类,还有混合类,后两类的客户比例是非常低的,月度的数据可以综合出客户在17个月中主要做的业务。有了客户主营业务的分类以后,我们可以继续来看客户流失的场景是什么,第一个场景就是刚才说的大额的消费、大额的刷卡。储蓄中断,客户的储蓄持续几个月有100万,突然就不见了,他是转移到了其它银行,至于转移到了其它银行做什么事情我们不清楚。理财的转移,在这个客户降级、流失之前,我们猜测这些人多数人去其它银行多数做理财产品。
同样,流失级别不能一概而论,我们会把客户流失严重程度分为从轻到重。所有的客户流失级别里面,大概有一半多的人是没有流失的,级别甚至是有所提高的,有17-18%的人是流失了的客户。再看做什么主业的客户容易流失?贷款里面蓝条是没有流失的,做贷款的客户是最稳定的,这并不是个很低的门槛。做储蓄的人是最容易流失的,因为储蓄转移的成本是最低的,网银现在转移储蓄肯定两块钱就转走了。
我们还可以看一看全部客户的主业分布图,高端客户里有43%的人是做贷款的,发生降级、流失的客户储蓄减少了、贷款增加了,验证了上面的信息。还有一些基础信息,地域中西部地区是最稳定的,36岁以下的客户愿意做的业务是贷款业务,非常稳定,55岁以上的客户储蓄理财的比例是比较大的,因此流失率也是比较高的。
有了以上的一些交叉分析以后,我们重点看了几个场景:一个是理财转移,理财转移在这段时间内给这家银行带来了大概104亿AUM的损失,大概有1/7的理财客户转移了以后有所恢复,也有1/7的客户转移了以后没有恢复。理财转移的客户偏好的产品和其它客户有没有区别?我们做个对比。可以看到转移的期限,左下角使转移和流失的客户更喜欢稳健型的产品。能不能预测一下贷款的余额占总额的百分比到底什么的时候,客户一次性提前还款的可能性较高,我们做了简单这样的统计度,平均的提前还款率是条红线,下面的横坐标是贷款的余额占的百分之比,贷款余额降到25%之后的时候提前还款率是非常高的。
最终,我们对这个银行给出了一些业务上的建议,比如对储蓄类客户推荐更多产品,尤其是提升交叉营销率,提高他的转移成本,其中交叉营销率都是重要的变量,对于理财客户要及时推荐给他符合偏好的产品,利用网银做好产品的衔接与客户挽留。对贷款的客户要做好提前布局,到当时他的贷款余额降到30%左右空间的时候要重点关注,预判到可能发生提前还款的时候,尤其是可以利用网银迅速的做出一些产品的推荐,比如给他推荐一款理财产品,早期的像房贷拿到7折利率的话,现在大概是4.6%左右的利率水平,现在很多银行理财产品都可以达到这一水平,甚至5%以上。有这样的网银推荐给客户的时候,他就要考虑我是不是要提前还款,他如果购买这个理财的话其实实现了双赢,银行留住了客户,这个人也拿到了更好的利率。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在 MySQL 实际应用中,“频繁写入同一表” 是常见场景 —— 如实时日志存储(用户操作日志、系统运行日志)、高频交易记录(支付 ...
2025-10-30为帮助教育工作者、研究者科学分析 “班级规模” 与 “平均成绩” 的关联关系,我将从相关系数的核心定义与类型切入,详解 “数 ...
2025-10-30对 CDA(Certified Data Analyst)数据分析师而言,“相关系数” 不是简单的数字计算,而是 “从业务问题出发,量化变量间关联强 ...
2025-10-30在构建前向神经网络(Feedforward Neural Network,简称 FNN)时,“隐藏层数目设多少?每个隐藏层该放多少个神经元?” 是每个 ...
2025-10-29这个问题切中了 Excel 用户的常见困惑 —— 将 “数据可视化工具” 与 “数据挖掘算法” 的功能边界混淆。核心结论是:Excel 透 ...
2025-10-29在 CDA(Certified Data Analyst)数据分析师的工作中,“多组数据差异验证” 是高频需求 —— 例如 “3 家门店的销售额是否有显 ...
2025-10-29在数据分析中,“正态分布” 是许多统计方法(如 t 检验、方差分析、线性回归)的核心假设 —— 数据符合正态分布时,统计检验的 ...
2025-10-28箱线图(Box Plot)作为展示数据分布的核心统计图表,能直观呈现数据的中位数、四分位数、离散程度与异常值,是质量控制、实验分 ...
2025-10-28在 CDA(Certified Data Analyst)数据分析师的工作中,“分类变量关联分析” 是高频需求 —— 例如 “用户性别是否影响支付方式 ...
2025-10-28在数据可视化领域,单一图表往往难以承载多维度信息 —— 力导向图擅长展现节点间的关联结构与空间分布,却无法直观呈现 “流量 ...
2025-10-27这个问题问到了 Tableau 中两个核心行级函数的经典组合,理解它能帮你快速实现 “相对位置占比” 的分析需求。“index ()/size ( ...
2025-10-27对 CDA(Certified Data Analyst)数据分析师而言,“假设检验” 绝非 “套用统计公式的机械操作”,而是 “将模糊的业务猜想转 ...
2025-10-27在数字化运营中,“凭感觉做决策” 早已成为过去式 —— 运营指标作为业务增长的 “晴雨表” 与 “导航仪”,直接决定了运营动作 ...
2025-10-24在卷积神经网络(CNN)的训练中,“卷积层(Conv)后是否添加归一化(如 BN、LN)和激活函数(如 ReLU、GELU)” 是每个开发者都 ...
2025-10-24在数据决策链条中,“统计分析” 是挖掘数据规律的核心,“可视化” 是呈现规律的桥梁 ——CDA(Certified Data Analyst)数据分 ...
2025-10-24在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23在数据分析全流程中,“数据清洗” 恰似烹饪前的食材处理:若食材(数据)腐烂变质、混杂异物(脏数据),即便拥有精湛的烹饪技 ...
2025-10-23在人工智能领域,“大模型” 已成为近年来的热点标签:从参数超 1750 亿的 GPT-3,到万亿级参数的 PaLM,再到多模态大模型 GPT-4 ...
2025-10-22在 MySQL 数据库的日常运维与开发中,“更新数据是否会影响读数据” 是一个高频疑问。这个问题的答案并非简单的 “是” 或 “否 ...
2025-10-22