
美国金融银行业的大数据算法:随机森林模型+综合模型
大数据的概念这两年非常火,对它的解读也是见仁见智。其实不管大数据也好,还是数据挖掘,或者机器智能,都只是个名词,代表了最先进的计算机数据存储和分析算法。它们的核心都是通过在看似变化莫测的数据中寻找规律来帮助解决实际问题,尤其是对未来的一些精准到个体的预测。比如如何最有效的寻找新客户,提高对现有客户的交叉销售以及防止客户流失,都是大数据的具有普遍性的典型应用。具体到银行业,就涉及到信用审批,额度确定,以及反欺诈等专业的应用。
我所就职的美国运通公司是全球知名的信用卡企业,道琼斯三十种工业股票之一。大数据技术被广泛应用于公司的各个部门,取得了令人瞩目的效果。公司的客户群信用非常好,坏账率只有1-2%,远远低于同行业中的其他企业。反欺诈也做得相当成功,在每年八千亿美元的刷卡量中仅造成一个亿左右的损失,占总量的约0.02%。此外公司通过细致分析持卡人的消费记录,并结合移动互联网,实时向用户推荐商家信息,进一步增加了公司的营收和客户忠诚度。
要做到这些好的业绩,仅靠个人经验和一些简单的规定是远远不够的,而必须依靠专业人员采用最先进和有效的数据挖掘算法。下面我就谈谈其中一些最主要的方法,希望对国内的同行能有所借鉴。
回归分析是数据挖掘中最常见和基本的算法,包括简单线性回归,逻辑回归以及其他的广义线性或非线性模型。它们在过去虽然被广泛使用,但存在明显的不足,尤其是变量的相互依存性会使结果发生偏差。为避免这些问题,近些年来美国银行业大量采用了树形算法家族。这其中包括决策树,聚类和回归树,以及较为复杂的随机森林模型。这些方法避免了变量间的相互依存性问题,而且预测分析能力也逐步增强。不过随机森林模型的复杂性使得结果有时不容易理解,新近出现的梯度递增树算法,在预测能力和可理解性方面都强于随机森林,而且适用的范围广,在反欺诈和其他一些领域被证明效果非常好,很值得业内人士关注。
除了树形算法以外,关联分析和序列分析也是最近比较热门的算法。关联分析的核心是寻找与一个客户相关的其他人,通过他们的行为来预测这个客户。序列分析则是通过跟踪一个客户在一段时间内的多个行为来寻找规律,判断他下一步可能的动作。这些算法虽然概念易懂,实际操作起来并不那么简单,需要相当一段时间的实践摸索。如果模型建得好,往往可以有事半功倍的效果。其他的著名算法还很多,比如支持向量模型,深度神经网络等等,这里就不再一一而足了。
算法这么多,自然就存在如何选择的问题,或者也可以同时使用多个算法,然后让他们投票决定结果,这种思路最近也很流行,称为综合模型算法。另外如何选择变量和进行变换,如何验证模型的正确性,和如何及时更新以防模型失效也都很有讲究,必须每一步都认真仔细进行才能产生令人满意的结果。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
2025 年,数据如同数字时代的 DNA,编码着人类社会的未来图景,驱动着商业时代的运转。从全球互联网用户每天产生的2.5亿TB数据, ...
2025-05-27CDA数据分析师证书考试体系(更新于2025年05月22日)
2025-05-26解码数据基因:从数字敏感度到逻辑思维 每当看到超市货架上商品的排列变化,你是否会联想到背后的销售数据波动?三年前在零售行 ...
2025-05-23在本文中,我们将探讨 AI 为何能够加速数据分析、如何在每个步骤中实现数据分析自动化以及使用哪些工具。 数据分析中的AI是什么 ...
2025-05-20当数据遇见人生:我的第一个分析项目 记得三年前接手第一个数据分析项目时,我面对Excel里密密麻麻的销售数据手足无措。那些跳动 ...
2025-05-20在数字化运营的时代,企业每天都在产生海量数据:用户点击行为、商品销售记录、广告投放反馈…… 这些数据就像散落的拼图,而相 ...
2025-05-19在当今数字化营销时代,小红书作为国内领先的社交电商平台,其销售数据蕴含着巨大的商业价值。通过对小红书销售数据的深入分析, ...
2025-05-16Excel作为最常用的数据分析工具,有没有什么工具可以帮助我们快速地使用excel表格,只要轻松几步甚至输入几项指令就能搞定呢? ...
2025-05-15数据,如同无形的燃料,驱动着现代社会的运转。从全球互联网用户每天产生的2.5亿TB数据,到制造业的传感器、金融交易 ...
2025-05-15大数据是什么_数据分析师培训 其实,现在的大数据指的并不仅仅是海量数据,更准确而言是对大数据分析的方法。传统的数 ...
2025-05-14CDA持证人简介: 万木,CDA L1持证人,某电商中厂BI工程师 ,5年数据经验1年BI内训师,高级数据分析师,拥有丰富的行业经验。 ...
2025-05-13CDA持证人简介: 王明月 ,CDA 数据分析师二级持证人,2年数据产品工作经验,管理学博士在读。 学习入口:https://edu.cda.cn/g ...
2025-05-12CDA持证人简介: 杨贞玺 ,CDA一级持证人,郑州大学情报学硕士研究生,某上市公司数据分析师。 学习入口:https://edu.cda.cn/g ...
2025-05-09CDA持证人简介 程靖 CDA会员大咖,畅销书《小白学产品》作者,13年顶级互联网公司产品经理相关经验,曾在百度、美团、阿里等 ...
2025-05-07相信很多做数据分析的小伙伴,都接到过一些高阶的数据分析需求,实现的过程需要用到一些数据获取,数据清洗转换,建模方法等,这 ...
2025-05-06以下的文章内容来源于刘静老师的专栏,如果您想阅读专栏《10大业务分析模型突破业务瓶颈》,点击下方链接 https://edu.cda.cn/g ...
2025-04-30CDA持证人简介: 邱立峰 CDA 数据分析师二级持证人,数字化转型专家,数据治理专家,高级数据分析师,拥有丰富的行业经验。 ...
2025-04-29CDA持证人简介: 程靖 CDA会员大咖,畅销书《小白学产品》作者,13年顶级互联网公司产品经理相关经验,曾在百度,美团,阿里等 ...
2025-04-28CDA持证人简介: 居瑜 ,CDA一级持证人国企财务经理,13年财务管理运营经验,在数据分析就业和实践经验方面有着丰富的积累和经 ...
2025-04-27数据分析在当今信息时代发挥着重要作用。单因素方差分析(One-Way ANOVA)是一种关键的统计方法,用于比较三个或更多独立样本组 ...
2025-04-25