京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据应用 信用评分及模型原理解析
虽然人人都可以通过对借款方在Lending Club和Prosper上的历史借贷数据进行分析,但我相信,了解消费信贷行为、评分机制和贷款决策背后的工作原理可以帮助投资人更好的在市场中进行决策,获得收益。
消费信贷一直是推动世界领先国家经济转型的主要力量。在过去的50年里,消费开支也因此有所增加。根据纽约联邦储备银行家庭债务和信用季度报告,2014年8月,消费者负债总额为11.63万亿美元,其中74%为按揭和净值贷款,10%为学生贷款,8%为汽车贷款,以及6%为信用卡债务。消费信贷需求增长率极高,自动化风险评估系统势在必行。
信用评分最早始于上世纪50年代初。信用评分最初使用统计学方法来区分优秀和不良贷款。最初,信用评分的重点是是否要给贷方发放贷款,后来,这种行为转变成了申请人评分(applicant scoring)。信用评分借着申请人评分这一项成为了一项成功的评价系统。
在信用评分中,信贷价值假设会在未来的几年保持稳定,贷方会对申请人是否会在未来的12个月内出现90天以上的逾期支付进行评估。申请成功时申请人的最低评分是该分值边际良好和不良贷款几率相比而来,即会额外通过的优秀贷款与不良贷款的比例。申请者贷款1-2年以来的数据,加上相应的信用记录将帮助建立申请者未来2年左右的申请评分模型。
行为评分(Behavioral scoring),是申请人评分的一个补充,旨在评估申请人在过去一年中支付和购买行为的状况。 此数据用于预测未来12个月的违约风险情况,通常每个月更新一次数据。最近表现和当前信贷信息比最开始的申请信息更为重要。
比起违约风险,如今贷款方更加注重能满足他们盈利目标的贷款战略。他们可以选择贷款额、利率及其他条款,从而最大限度地提高盈利能力。基于盈利能力而做出决策的技术分析叫做利润评分(profit scoring)。
与可使用静态信用评分模式的申请人评分不同,行为评分和利润评分需要使用动态信用评分模式,即要将过去的信贷行为纳入考虑范围。 一般来说,信用评分模型会分别为每一笔借贷建模。但是,由于借款人贷款组合违约情况(信用风险)增高,所借款项的重要性便今非昔比了。目前为止没有广泛接受的用于评估贷款组合的信用风险模型。
您可以通过评估系统识别优秀及不良贷款的能力,预测概率的精确性以及分类预测的准确性这三点来评估一个信用评分模型。
贷款人的主要目标是在其投资组合中获得利润最大化。对于任何一笔贷款中,投资人都需要考虑贷款回报额。投资100美元,获利10美元显然不如投资25美元,获得3美元回报。
有些情况下,借款人无法偿还贷款,这就意味着贷款人甚至会面临重大损失。我们可以通过分析投资组合违约率及违约结果对风险进行量化。贷款人还可以将风险和回报设定在预期的范围内。
最终是否投资给借款人需要基于一系列决策:即哪些信息将有助于作出决策,在决策过程期间和之后贷款会有何发展以及最终可能出现的结果。
影响图网用可视化的图形帮助投资人了解主要决策、不确定性、相关信息以及最终成果是如何相互影响的。
影响图网可以确定决策的重要方面,有哪些数据与决策相关,以及在哪些方面有关。图网包括三种节点:决策(长方形节点),不确定事件(圆形节点),以及结果(菱形节点)。各节点由箭头相互连接。图1从市场中贷款人的角度进行绘制。
图1中,首先,贷款人获得借款人是否会有良好表现的贷款预测。预测是随机事件,因为贷款人不能决定预测的结果。它将影响投资与否(Loan or not)的决策,也会影响借款人的表现(Borrower good or bad)。接着,平台将决定是否发布贷款(Loan issued or not)。这对贷款人来说是随机事件。除非该贷款没有得到足够的贷款人支持,否则贷款人对是否发布贷款没有决定权或影响力。贷款一旦发布,贷款人就可以检验收入证明(Income verification)执行情况,查看FICO分数及还款记录(FICO score and payment history.)是否有变化,并更新贷款预测。根据更新后的贷款预测,贷款人可以决定是否要在FILOfn二级交易平台上卖出贷款。类似的,其他贷款人也可以在二级交易平台上很据更新的贷款预测决定是否买入贷款。这一系列事件会最终影响贷款人的收益。
决策树确定贷款中有哪些最优决策,并按照决策过程中信息的了解顺序来解析决策的各个步骤。
那么决策树模型又是如何根据可视化影响图网中的结构逐渐形成的呢?决策树与影像图网的结构类似。其结果由以数字代表的回报事件表示。每个机会节点(不确定事件)都被赋予一定比重,比重代表事件结果发生的可能性。
从结果点开始往回推,经过所有决策及不确定事件的节点后,可以计算出每个结果的预期货币值(EMV)。
图2是一个简单的贷款决策的决策树。贷款人对是否进行投资做出了一份初期判断。如果贷款人不愿投资,则回报是0。如果贷款人投资,则有两种可能:投资回报良好,或不好(即违约)。
假设,借款人回报良好时,贷款人获益10,借款人违约时,贷款人则损失100。如果违约可能性是5%,并且贷款人愿意投资,则贷款人可能从借款人处获益:
0.95 x 10 + 0.05 x (-100) = 4.5
如果贷款人不愿投资,则获益为0。因此,决策树显示贷款人应该进行投资。如果违约的可能性增加到10%,则贷款人可能从借款人处获益:
0.90 x 10 + 0.10 x (-100) = -1
因此,决策树显示贷款人不应该进行投资。
综上所示,如果g代表贷款人收益,l代表因借款人违约导致的贷款人损失,p代表投资回报良好的可能性,那么根据预期货币值(EMV)的标准,只有 pg – (1-p)l > 0时,贷款人应该进行投资。
p/(1-p)即投资回报良好的可能性与违约可能性的比值,也称为良莠比(good:bad odds)。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
B+树作为数据库索引的核心数据结构,其高效的查询、插入、删除性能,离不开节点间指针的合理设计。在日常学习和数据库开发中,很 ...
2026-01-30在数据库开发中,UUID(通用唯一识别码)是生成唯一主键、唯一标识的常用方式,其标准格式包含4个短横线(如550e8400-e29b-41d4- ...
2026-01-30商业数据分析的价值落地,离不开标准化、系统化的总体流程作为支撑;而CDA(Certified Data Analyst)数据分析师,作为经过系统 ...
2026-01-30在数据分析、质量控制、科研实验等场景中,数据波动性(离散程度)的精准衡量是判断数据可靠性、稳定性的核心环节。标准差(Stan ...
2026-01-29在数据分析、质量检测、科研实验等领域,判断数据间是否存在本质差异是核心需求,而t检验、F检验是实现这一目标的经典统计方法。 ...
2026-01-29统计制图(数据可视化)是数据分析的核心呈现载体,它将抽象的数据转化为直观的图表、图形,让数据规律、业务差异与潜在问题一目 ...
2026-01-29箱线图(Box Plot)作为数据分布可视化的核心工具,能清晰呈现数据的中位数、四分位数、异常值等关键统计特征,广泛应用于数据分 ...
2026-01-28在回归分析、机器学习建模等数据分析场景中,多重共线性是高频数据问题——当多个自变量间存在较强的线性关联时,会导致模型系数 ...
2026-01-28数据分析的价值落地,离不开科学方法的支撑。六种核心分析方法——描述性分析、诊断性分析、预测性分析、规范性分析、对比分析、 ...
2026-01-28在机器学习与数据分析领域,特征是连接数据与模型的核心载体,而特征重要性分析则是挖掘数据价值、优化模型性能、赋能业务决策的 ...
2026-01-27关联分析是数据挖掘领域中挖掘数据间潜在关联关系的经典方法,广泛应用于零售购物篮分析、电商推荐、用户行为路径挖掘等场景。而 ...
2026-01-27数据分析的基础范式,是支撑数据工作从“零散操作”走向“标准化落地”的核心方法论框架,它定义了数据分析的核心逻辑、流程与目 ...
2026-01-27在数据分析、后端开发、业务运维等工作中,SQL语句是操作数据库的核心工具。面对复杂的表结构、多表关联逻辑及灵活的查询需求, ...
2026-01-26支持向量机(SVM)作为机器学习中经典的分类算法,凭借其在小样本、高维数据场景下的优异泛化能力,被广泛应用于图像识别、文本 ...
2026-01-26在数字化浪潮下,数据分析已成为企业决策的核心支撑,而CDA数据分析师作为标准化、专业化的数据人才代表,正逐步成为连接数据资 ...
2026-01-26数据分析的核心价值在于用数据驱动决策,而指标作为数据的“载体”,其选取的合理性直接决定分析结果的有效性。选对指标能精准定 ...
2026-01-23在MySQL查询编写中,我们习惯按“SELECT → FROM → WHERE → ORDER BY”的语法顺序组织语句,直觉上认为代码顺序即执行顺序。但 ...
2026-01-23数字化转型已从企业“可选项”升级为“必答题”,其核心本质是通过数据驱动业务重构、流程优化与模式创新,实现从传统运营向智能 ...
2026-01-23CDA持证人已遍布在世界范围各行各业,包括世界500强企业、顶尖科技独角兽、大型金融机构、国企事业单位、国家行政机关等等,“CDA数据分析师”人才队伍遵守着CDA职业道德准则,发挥着专业技能,已成为支撑科技发展的核心力量。 ...
2026-01-22在数字化时代,企业积累的海量数据如同散落的珍珠,而数据模型就是串联这些珍珠的线——它并非简单的数据集合,而是对现实业务场 ...
2026-01-22