京公网安备 11010802034615号
经营许可证编号:京B2-20210330
融道网探索大数据风控_数据分析师
风险控制一直是P2P行业的热门话题。与银行不同的是,P2P公司面对的借款人大多是轻资产的中小微企业或者工薪阶层的个人,很多情况下他们缺乏抵押担保物,这意味着借款有更高的风险,P2P平台进行风险控制的难度也更大。
为了保证风控,P2P公司都在各自采取对策。不久前,融道网和上海财经大学信息管理学院签订了战略合作协议,打算一起构建“大数据的P2P风险控制模型”。
融道网首席风控官杨琨接受了记者的采访,他描述了大数据技术在行业风控的应用。“我们正在建一个大的数据模型,这个模型可能颠覆P2P行业的风控理念。”杨琨说。
用大数据还原人性
融道网和财大的战略合作,是想通过收集和分析借款申请人切身相关的数据和信息,来判断这个人的信用状况,并确定对他的授信额度。上海财大会搭建一个理论分析模型,融道网则为上海财经大学提供相关数据,并参与模型的优化设计。
基于这个模型,融道网会让客户提供一些信息,这些信息可能增加对该客户的授信。“如果你什么都不提供,可能只能获得1万元的贷款,提供更多信息,就可能是5万,你同意的话就在授权协议书上签字,提供自己的网购账号以及微信、微博、博客账号,也可以自己补充,这都是和日常相关的信息。”杨琨解释。
但上述模型尚在测试阶段,推广到完全地应用,可能至少是一年以后。
研发团队正在发掘这些信息与个人诚信之间的关联。“有些是很简单的道理,一个手机号码5年不变的人和一年换5个号码的人,你觉得谁更有诚信?”杨琨如此形容。
不论微博、微信或者个人的其他账号,都能挖掘出很多有价值的东西。比如去看手机通话详单,分析这个人的通话对象,如果他联系的大多是中介、法院或者催债公司,这个人的名声可能就不大好,而如果和公司业务上下游联系得更多,说明这个人生意做得不错。
杨琨说,系统会关注这个人平时的生活轨迹、发表什么样的评论,以及他的爱好如何。这些信息没有好与不好之分,他们会选择适合融道网的借款人,他认为一个比较宅的人,获得的信息有限,意味着未来发展空间有限,他们可能只会给他短期授信;那些积极在外接触并扩大朋友圈的人,他们的职业发展潜力更大,则可以把贷款期限放长一点。
“我喜欢他能发些正面的信息,约朋友吃饭,到哪里买了什么东西,或者去旅游,我觉得这个人应该面对的生活圈就是这样。”杨琨表示。
购物习惯是一项重要的参考,偏爱在哪一类电商购物能大致反映一个人对品质的要求并对他的消费能力做出初步推断。“我们会通过网站的类别来分辨一些信息,如果你经常在苏宁、京东购物,可能是个数码发烧友,我们认为他的消费能力应该高于常在淘宝买衣服的人。”杨琨说。
融道网还会收集借款人的文本,比如让他写一段话说明申请贷款的用途,怎么规划这笔贷款。“从文本入手分析,首先看看字怎么样,再看他的语言组织能力,这能看出他受教育的程度和管理能力,这些东西很有用。”杨琨说。
模型的意义在于把各类信息数据化。比如,一个人在什么地方吃饭、人均消费怎么样、一年去旅游几次、旅游地的平均花费在什么水平,这些数据会形成报告。杨琨介绍,只要把信息发给上海财大,在很短的时间内就能出结果,他们有一套爬虫软件来进行匹配,抓取关键信息导入分析系统,就能得出这是个什么样的人。
报告会作为融道网在风控审核时的重要参考,再比对传统风控审查的数据,看两者是否吻合。杨琨相信,这个模型可能颠覆P2P行业的风控理念,即摆脱对传统数据报表的依赖。
“准备贷款的时候,要很用心地去编辑微信圈,还要持续一段比较长的时间,还是蛮难的,这些随时发生的东西很难作假。”他说。
他们希望以后把这个模式向整个行业推广。“项目的进展还没那么快,暂时只能抓取部分信息,我们的设想是读出这个人。”杨琨表示。
传统风控创新
除了大数据技术之外,杨琨也介绍了融道网在传统风控手法上所做的一些创新。
他提到,传统的审批模式,整个审批流程所有步骤都集中在一个人身上,很容易产生道德风险,所以他借鉴了德国信贷工厂的模式,把审批分成了几个环节,每个环节都由不同的人负责。
“我把审批分了几个环节,第一是算流水,然后是网查,接下来是央行征信报告解析,再是反欺诈,第五个环节是分审,然后是实地征信,最后一个环节是终审。每个环节都是独立的,各有权限,比如算流水的不会告诉你流水是好是坏,只会给出流水是怎么样的,都是表格化来完成;网查的只会把好与坏的信息都列出来,比如客户得了什么奖,或者遭到了什么样的投诉。”
最后这些客观的信息陈述会汇总到终审,由终审人员给出授信。杨琨相信,这样能最大程度地降低道德风险,因为一个信贷员很难把所有环节的人员全部打通。另外,这种做法也有助于降低人力成本,他把每一个岗位负责的事情都标准化了,比如算流水有固定的公式,网查也有固定的网站和分类标准,一个新人不需要太多培训就能很好地适应,而且每个人在做重复简单的工作,熟练程度很快就提升了,也有助于降低差错。
“我们的实习生算流水的速度比有几年工作经验的人还快,他们自己算得多了,也一直在动脑筋想怎么算更快、更有效率。”杨琨说。
除了贷前审核之外,杨琨在贷后风控上也想了很多办法。比如他们在借款公司的打卡处安装了智能摄像头,根据摄像头每天早上统计的打卡人数来计算公司出勤率,假如公司有80个人,某天有64人打卡,那么出勤率在80%,可以认为公司在正常运营;要是某天只有20人打卡,连续几天,说明员工大量流失或者被裁员,企业经营很可能出现了问题。
他还会要求借款公司出具电费账单,对比公司的设备额定功率来计算机器的开工时间。杨琨强调,风控不是简单的流程工作,除了审查报表之外,必须自己去想很多不同的方法,通过各个角度来判断风险。
杨琨在风控领域已经很多年,他最早在2002年加入招商银行(600036,股吧)做信用卡风控,几年后到美国学习并加入了高盛国际投行部,2011年回国后杨琨加入了证大财富,后来到合盘贷,都是负责包括风控在内的工作,2014年11月他到融道网任首席风控官。
“我为合盘贷设计的风控,坏账率1.87%,比银行要低;现在在融道网做了这么多还没有坏账。我们充分验证了,在快速有效建立风控机制的时候,熟练工非常重要。”杨琨说。
杨琨认为,因为借款人属性不同,传统的银行风控手段,比如看报表、调查财产状况、抵押担保等,应用到P2P行业会遇到一些瓶颈;而现在很多P2P行业的风控人员都来自传统金融机构,如果不对目标客户群做一个系统的分析,很容易产生问题。
进入P2P行业近4年,不管是进行中的大数据技术,还是已经验证过的信贷工厂模式,杨琨表示,他一直在摸索一套适合中国本土的风控体系建设。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在统计学分析、实验研究、业务数据复盘过程中,单因素方差分析是检验自变量对因变量是否存在显著影响的核心方法。其中,两个水平 ...
2026-05-26【核心关键词】算法、客户、大数据、互联网、调优、建模、模型优化、机器学习、评分卡模型、模型开发、智能风控、业务场景、数 ...
2026-05-26 很多数据分析师写过无数个 SELECT,但当被问到“新建一张表,该如何定义字段类型来保证数据质量”“创建视图和存储物理表有 ...
2026-05-26在数据清洗、统计分析与数据质量检测工作中,箱型图(又称箱线图、Box Plot)是最直观、最高效的可视化分析工具之一。相较于柱状 ...
2026-05-25在大数据分析、数据清洗、质量管控、风险监测等领域,异常数据识别是保障数据质量、确保分析结论精准、规避业务决策失误的核心基 ...
2026-05-25 很多数据分析师精通Excel函数和透视表,但当被问到“数据从哪里来”“表和视图有什么区别”“数据库管理系统和SQL是什么关系 ...
2026-05-25数字化经营时代,企业的市场竞争早已从经验决策转向数据决策。门店营收、用户转化、产品销量、成本损耗、存量资产等所有经营行为 ...
2026-05-22在MySQL数据库日常运维、业务数据校验、数据迁移与数据清洗场景中,自增主键ID的连续性校验是一项基础且关键的工作。MySQL的Auto ...
2026-05-22 很多企业团队并非缺乏指标,而是陷入“指标失控”:仪表盘上堆满实时跳动的数据,却无法回答“当前瓶颈在哪、下一步该做什么 ...
2026-05-22【核心关键词】大数据、可视化、存储、架构、客户、离线、产品、同步、实时、数据仓库、数据分析、数据可视化、存储数据、离线 ...
2026-05-21在电商流量红利消退、公域获客成本持续走高的当下,存量用户深度挖掘已成为店铺增收增效的核心抓手。相较于付费投放获取的陌生新 ...
2026-05-21 很多数据分析师每天盯着几十个指标,但当被问到“这套指标要支撑什么业务目标”“指标之间是什么逻辑关系”“业务变化时如何 ...
2026-05-21在数据驱动决策的时代,数据质量直接决定分析结果的可靠性与准确性,而异常值作为数据清洗中的核心痛点,往往会扭曲分析结论、误 ...
2026-05-20 很多数据分析师每天盯着GMV、DAU、转化率,但当被问到“哪些指标在所有行业都适用”“哪些指标只对电商有意义”“二者如何搭 ...
2026-05-20Agent的能力边界,很大程度上取决于其掌握的Skill质量和数量。传统做法是靠人工编写和维护Skill,但这条路很快会遇到瓶颈。业务 ...
2026-05-20在统计分析中,方差分析(ANOVA)是一种常用的假设检验方法,核心用于分析“一个或多个自变量对单个因变量的影响”,广泛应用于 ...
2026-05-19 很多数据分析师每天盯着GMV、DAU、转化率,但当被问到“什么是指标”“指标和维度有什么区别”“如何定义指标值的计算规则和 ...
2026-05-19想高效备考 CDA 一级,拒绝盲目刷题、冗余学习?《CDA 一级教材知识手册》重磅来袭!以官方教材为核心,浓缩 13 章 103 个核心考 ...
2026-05-19在数据统计分析中,卡方检验是一种常用的非参数检验方法,核心用于判断两个或多个分类变量之间是否存在显著关联,广泛应用于市场 ...
2026-05-18在企业数字化转型的浪潮中,很多企业陷入了“技术堆砌”的误区——上线了ERP、CRM、BI等各类系统,积累了海量数据,却依然面临“ ...
2026-05-18