京公网安备 11010802034615号
经营许可证编号:京B2-20210330
融道网探索大数据风控_数据分析师
风险控制一直是P2P行业的热门话题。与银行不同的是,P2P公司面对的借款人大多是轻资产的中小微企业或者工薪阶层的个人,很多情况下他们缺乏抵押担保物,这意味着借款有更高的风险,P2P平台进行风险控制的难度也更大。
为了保证风控,P2P公司都在各自采取对策。不久前,融道网和上海财经大学信息管理学院签订了战略合作协议,打算一起构建“大数据的P2P风险控制模型”。
融道网首席风控官杨琨接受了记者的采访,他描述了大数据技术在行业风控的应用。“我们正在建一个大的数据模型,这个模型可能颠覆P2P行业的风控理念。”杨琨说。
用大数据还原人性
融道网和财大的战略合作,是想通过收集和分析借款申请人切身相关的数据和信息,来判断这个人的信用状况,并确定对他的授信额度。上海财大会搭建一个理论分析模型,融道网则为上海财经大学提供相关数据,并参与模型的优化设计。
基于这个模型,融道网会让客户提供一些信息,这些信息可能增加对该客户的授信。“如果你什么都不提供,可能只能获得1万元的贷款,提供更多信息,就可能是5万,你同意的话就在授权协议书上签字,提供自己的网购账号以及微信、微博、博客账号,也可以自己补充,这都是和日常相关的信息。”杨琨解释。
但上述模型尚在测试阶段,推广到完全地应用,可能至少是一年以后。
研发团队正在发掘这些信息与个人诚信之间的关联。“有些是很简单的道理,一个手机号码5年不变的人和一年换5个号码的人,你觉得谁更有诚信?”杨琨如此形容。
不论微博、微信或者个人的其他账号,都能挖掘出很多有价值的东西。比如去看手机通话详单,分析这个人的通话对象,如果他联系的大多是中介、法院或者催债公司,这个人的名声可能就不大好,而如果和公司业务上下游联系得更多,说明这个人生意做得不错。
杨琨说,系统会关注这个人平时的生活轨迹、发表什么样的评论,以及他的爱好如何。这些信息没有好与不好之分,他们会选择适合融道网的借款人,他认为一个比较宅的人,获得的信息有限,意味着未来发展空间有限,他们可能只会给他短期授信;那些积极在外接触并扩大朋友圈的人,他们的职业发展潜力更大,则可以把贷款期限放长一点。
“我喜欢他能发些正面的信息,约朋友吃饭,到哪里买了什么东西,或者去旅游,我觉得这个人应该面对的生活圈就是这样。”杨琨表示。
购物习惯是一项重要的参考,偏爱在哪一类电商购物能大致反映一个人对品质的要求并对他的消费能力做出初步推断。“我们会通过网站的类别来分辨一些信息,如果你经常在苏宁、京东购物,可能是个数码发烧友,我们认为他的消费能力应该高于常在淘宝买衣服的人。”杨琨说。
融道网还会收集借款人的文本,比如让他写一段话说明申请贷款的用途,怎么规划这笔贷款。“从文本入手分析,首先看看字怎么样,再看他的语言组织能力,这能看出他受教育的程度和管理能力,这些东西很有用。”杨琨说。
模型的意义在于把各类信息数据化。比如,一个人在什么地方吃饭、人均消费怎么样、一年去旅游几次、旅游地的平均花费在什么水平,这些数据会形成报告。杨琨介绍,只要把信息发给上海财大,在很短的时间内就能出结果,他们有一套爬虫软件来进行匹配,抓取关键信息导入分析系统,就能得出这是个什么样的人。
报告会作为融道网在风控审核时的重要参考,再比对传统风控审查的数据,看两者是否吻合。杨琨相信,这个模型可能颠覆P2P行业的风控理念,即摆脱对传统数据报表的依赖。
“准备贷款的时候,要很用心地去编辑微信圈,还要持续一段比较长的时间,还是蛮难的,这些随时发生的东西很难作假。”他说。
他们希望以后把这个模式向整个行业推广。“项目的进展还没那么快,暂时只能抓取部分信息,我们的设想是读出这个人。”杨琨表示。
传统风控创新
除了大数据技术之外,杨琨也介绍了融道网在传统风控手法上所做的一些创新。
他提到,传统的审批模式,整个审批流程所有步骤都集中在一个人身上,很容易产生道德风险,所以他借鉴了德国信贷工厂的模式,把审批分成了几个环节,每个环节都由不同的人负责。
“我把审批分了几个环节,第一是算流水,然后是网查,接下来是央行征信报告解析,再是反欺诈,第五个环节是分审,然后是实地征信,最后一个环节是终审。每个环节都是独立的,各有权限,比如算流水的不会告诉你流水是好是坏,只会给出流水是怎么样的,都是表格化来完成;网查的只会把好与坏的信息都列出来,比如客户得了什么奖,或者遭到了什么样的投诉。”
最后这些客观的信息陈述会汇总到终审,由终审人员给出授信。杨琨相信,这样能最大程度地降低道德风险,因为一个信贷员很难把所有环节的人员全部打通。另外,这种做法也有助于降低人力成本,他把每一个岗位负责的事情都标准化了,比如算流水有固定的公式,网查也有固定的网站和分类标准,一个新人不需要太多培训就能很好地适应,而且每个人在做重复简单的工作,熟练程度很快就提升了,也有助于降低差错。
“我们的实习生算流水的速度比有几年工作经验的人还快,他们自己算得多了,也一直在动脑筋想怎么算更快、更有效率。”杨琨说。
除了贷前审核之外,杨琨在贷后风控上也想了很多办法。比如他们在借款公司的打卡处安装了智能摄像头,根据摄像头每天早上统计的打卡人数来计算公司出勤率,假如公司有80个人,某天有64人打卡,那么出勤率在80%,可以认为公司在正常运营;要是某天只有20人打卡,连续几天,说明员工大量流失或者被裁员,企业经营很可能出现了问题。
他还会要求借款公司出具电费账单,对比公司的设备额定功率来计算机器的开工时间。杨琨强调,风控不是简单的流程工作,除了审查报表之外,必须自己去想很多不同的方法,通过各个角度来判断风险。
杨琨在风控领域已经很多年,他最早在2002年加入招商银行(600036,股吧)做信用卡风控,几年后到美国学习并加入了高盛国际投行部,2011年回国后杨琨加入了证大财富,后来到合盘贷,都是负责包括风控在内的工作,2014年11月他到融道网任首席风控官。
“我为合盘贷设计的风控,坏账率1.87%,比银行要低;现在在融道网做了这么多还没有坏账。我们充分验证了,在快速有效建立风控机制的时候,熟练工非常重要。”杨琨说。
杨琨认为,因为借款人属性不同,传统的银行风控手段,比如看报表、调查财产状况、抵押担保等,应用到P2P行业会遇到一些瓶颈;而现在很多P2P行业的风控人员都来自传统金融机构,如果不对目标客户群做一个系统的分析,很容易产生问题。
进入P2P行业近4年,不管是进行中的大数据技术,还是已经验证过的信贷工厂模式,杨琨表示,他一直在摸索一套适合中国本土的风控体系建设。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据分析、机器学习的实操场景中,聚类分析与主成分分析(PCA)是两种高频使用的统计与数据处理方法。二者常被用于数据预处理 ...
2026-02-24在聚类分析的实操场景中,K-Means算法因其简单高效、易落地的特点,成为处理无监督分类问题的首选工具——无论是用户画像分层、 ...
2026-02-24数字化浪潮下,数据已成为企业核心竞争力,“用数据说话、用数据决策”成为企业发展的核心逻辑。CDA(Certified Data Analyst) ...
2026-02-24CDA一级知识点汇总手册 第五章 业务数据的特征、处理与透视分析考点52:业务数据分析基础考点53:输入和资源需求考点54:业务数 ...
2026-02-23CDA一级知识点汇总手册 第四章 战略与业务数据分析考点43:战略数据分析基础考点44:表格结构数据的使用考点45:输入数据和资源 ...
2026-02-22CDA一级知识点汇总手册 第三章 商业数据分析框架考点27:商业数据分析体系的核心逻辑——BSC五视角框架考点28:战略视角考点29: ...
2026-02-20CDA一级知识点汇总手册 第二章 数据分析方法考点7:基础范式的核心逻辑(本体论与流程化)考点8:分类分析(本体论核心应用)考 ...
2026-02-18第一章:数据分析思维考点1:UVCA时代的特点考点2:数据分析背后的逻辑思维方法论考点3:流程化企业的数据分析需求考点4:企业数 ...
2026-02-16在数据分析、业务决策、科学研究等领域,统计模型是连接原始数据与业务价值的核心工具——它通过对数据的规律提炼、变量关联分析 ...
2026-02-14在SQL查询实操中,SELECT * 与 SELECT 字段1, 字段2,...(指定个别字段)是最常用的两种查询方式。很多开发者在日常开发中,为了 ...
2026-02-14对CDA(Certified Data Analyst)数据分析师而言,数据分析的核心不是孤立解读单个指标数值,而是构建一套科学、完整、贴合业务 ...
2026-02-14在Power BI实操中,函数是实现数据清洗、建模计算、可视化呈现的核心工具——无论是简单的数据筛选、异常值处理,还是复杂的度量 ...
2026-02-13在互联网运营、产品迭代、用户增长等工作中,“留存率”是衡量产品核心价值、用户粘性的核心指标——而次日留存率,作为留存率体 ...
2026-02-13对CDA(Certified Data Analyst)数据分析师而言,指标是贯穿工作全流程的核心载体,更是连接原始数据与业务洞察的关键桥梁。CDA ...
2026-02-13在机器学习建模实操中,“特征选择”是提升模型性能、简化模型复杂度、解读数据逻辑的核心步骤——而随机森林(Random Forest) ...
2026-02-12在MySQL数据查询实操中,按日期分组统计是高频需求——比如统计每日用户登录量、每日订单量、每日销售额,需要按日期分组展示, ...
2026-02-12对CDA(Certified Data Analyst)数据分析师而言,描述性统计是贯穿实操全流程的核心基础,更是从“原始数据”到“初步洞察”的 ...
2026-02-12备考CDA的小伙伴,专属宠粉福利来啦! 不用拼运气抽奖,不用复杂操作,只要转发CDA真题海报到朋友圈集赞,就能免费抱走实用好礼 ...
2026-02-11在数据科学、机器学习实操中,Anaconda是必备工具——它集成了Python解释器、conda包管理器,能快速搭建独立的虚拟环境,便捷安 ...
2026-02-11在Tableau数据可视化实操中,多表连接是高频操作——无论是将“产品表”与“销量表”连接分析产品销量,还是将“用户表”与“消 ...
2026-02-11