京公网安备 11010802034615号
经营许可证编号:京B2-20210330
P2P大数据的争议与悖论_数据分析师培训
作为互联网金融的一种模式,P2P行业如何发展一直是舆论的焦点。其中最被大家推崇的一种观点是P2P的发展必须结合大数据,无论监管、媒体、还是我们从业者,都达成了共识,许多公司为之努力并且做了尝试。但是我却认为,P2P不能迷信大数据,大数据并不是万能的,与其执着于用大数据做风控,不如用来做营销。
一、P2P的大数据为什么做不了风控?
目前,在国内金融领域,用大数据做风控,成功的案例只有两家,一家是阿里小贷,另一家是证监会。阿里小贷通过卖家海量的交易信息和流水,在几秒钟内完成对商家的授信;证监会通过海量的交易信息挖掘出关联交易,捕捉老鼠仓的基金经理。也有其他一些电商平台号称利用大数据做风控审核,但是其模式的实质是应收账款质押融资(类似保理)或者是货物质押式融资。其实阿里和证监会之所以成功,原因在于两点,一、数据可以做到即时更新,既数据是鲜活的;二是平台本身对用户有约束力。这两点也被人们称为闭环的数据。那么问题就来了,目前国内的P2P公司并没有闭环的交易数据,对用户的约束力也不足够,那么又何来跟大数据结合一说呢?
有人说利用客户多维度的信息,例如近千个维度,对借款人做综合的评估。这种方式听起来不错,但实际情况是,对一个人信用的评估如果用这样的手段,会发现维度和维度之间并非相互独立的,而是有逻辑关系的,1000个维度中实际有用的维度可能只有100个,900个是没用的,也就是说这样一个风控模型几乎是建立不起来的,纬度的逻辑关系会有冲突,就算真的建立起来了,能通过该模型验证的也极可能是人格完美的人,例如耶稣和甘地,而不是金融信用良好的客户,不同的数据纬度应该对应一个人不同的方面,绝大多数的纬度根本体现和一个人金融信用的相关性。
再说数据来源,有一种说法是互联网上的社交数据可以作为参考依据,这其实牵涉到两个问题。其一,在互联网上人性是被放大的,现实中不敢说的话,在网络上却敢说,现实中内向的人在网络上或许会非常外向。也就是说互联网上的社交信息很难还原现实中人的信用;其二,社交信用并不一定能代表金融信用。据征信公司根据以往的征信记录来看,人的信用是多方面的,例如朋友信用、爱情信用、事业信用、其他社会信用和金融信用等,如果把每一类信用都看成一个面,其他几个面的信用与金融信用并不一定存在相关性。最近我去英国考察,国外有朋友用facebook上的社交数据做金融的尝试,即利用互联网上的个人信息评估其信用,并作授信。目前这项服务的相关数据还未披露,但是通过一些国外的朋友间接打听,网络上的社交金融可能并不成功,原因就在于此。
二、P2P的大数据如何做创新?
如果说P2P执着雨打数据风控,不如尝试用大数据做营销。事实上,大数据的提出者谷歌就是利用大数据做营销的。打比方说,现在新新贷有一位借款用户,如果他的借款次数在2次以上,且还款情况良好,可以通过数据分析,我们可以用系统的方式为他量身定制贷款方案,利率、手续费、还款方式、期限、额度等都会和原来的服务不同。
这个看似简单,背后要做的工作很多,首先要看过往的借款记录,新新贷会通过他的以往数据信息推算出他在什么时间节点需要资金周转,例如一个借款人申请借款的时间是8月,但可以通过计算得知他资金周转其实发生在6月,再分析数据,是因为5月份的货物滞压造成,再进一步分析造成货物滞压的原因。贷后管理中,客户经理会了解借款人的经营情况,根据更新过的数据,利用系统的方式推算出可能造成他下一次资金周转的时间,提前推送定制的服务方案。这种服务方案更像量身定制,而非让客户被动接受他不一定适合的信贷产品。在服务方案的制定过程中会根据他的年龄、学历、所在地区、交易流水等情况和数据库中类似的借款人做对比分析,评估他的优势劣势,和同行业企业的相似程度,根据以往借款人的额度、利率、还款方式等信息,重新评估当下借款人的额度、利率、还款方式等等。目前,我们已经尝试了几个这样的服务方案,做到了客户自己还没有发觉有融资问题是,我们就提前推送服务。
三、没有大数据,还能做数据挖掘
但是P2P最终还是希望用大数据完成授信和风险控制以降低服务成本。刚才已经谈到,那除非是用闭环的大数据才有可能,也就是说必须有数据即时更新和平台约束力两点。如果P2P无法直接做到这两点怎么办?我觉得可以通过其他的方式无限接近这两个特征。其一,不定期更新用户的数据,以我们来说,风控人员在客户贷后3个月后必须对客户进行2次尽职调查,对用户的信息做更新,重新评估其违约的概率。有人说这么做会增加成本,但P2P本来就在做商业银行和BAT都不做的脏活累活。对一家P2P公司来说,现在正处在数据原始积累的过程中,获取借款人越多真实数据越有利。未来P2P的核心竞争力与其说是风控能力,不如说是数据的积累和数据的处理能力。
另一方面,小微企业客户的账目往往混乱,在实际的风险控制中还需要还原他们的资产负债表和现金流量表,对他们进行财务输出,建立财务的标准,这些标准的信息积累就为数据积累做好了度量衡统一的准备。这些工作看似不够互联网化,不够科技化,但是只有这样的工作才能获得用户精准的数据,有效的数据,否则用系统的手段处理,就会在大量的洗脏数据的过程中,增加机会成本。
我个人认为,与其执着于在线上获取数据,不如脚踏实地在线下做好借款人的数据分析。例如,我们在数据积累的过程中,发现抽烟的借款人逾期率高于不抽烟的人,有宗教信仰的借款人逾期率低于没有宗教信仰的借款人,世界杯期间看足球的借款人违约率高于不看足球比赛的借款人。借款人的这些信息和数据几乎是没办法在线上获取的,即使获取也无法核实真伪,但是通过线下实地走访,这些信息很容易获得。这些有参考价值的数据对大数据和风险控制结合是有帮助,排除对借款人最有影响的地区、行业等因素,用户自身的一些行为是否存在相关性,是对风险控制审核的重要参考。
P2P结合大数据的路还很漫长,目前国内还没有成功的案例,大数据对P2P来说首先用于营销,其次用于风险控制,在数据的积累过程中去做更多深入的挖掘,可能才是真正的未来。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
日常用Excel做数据管理、台账维护、报表整理时,添加备注列是高频操作——用来标注异常、说明业务背景、记录处理进度、补充关键 ...
2026-03-23作为业内主流的自助式数据可视化工具,Tableau凭借拖拽式操作、强大的数据联动能力、灵活的仪表板搭建,成为数据分析师、业务人 ...
2026-03-23在CDA(Certified Data Analyst)数据分析师的日常工作与认证考核中,分类变量的关联分析是高频核心场景。用户性别是否影响商品 ...
2026-03-23在数据工作的全流程中,数据清洗是最基础、最耗时,同时也是最关键的核心环节,无论后续是做常规数据分析、可视化报表,还是开展 ...
2026-03-20在大数据与数据驱动决策的当下,“数据分析”与“数据挖掘”是高频出现的两个核心概念,也是很多职场人、入门学习者容易混淆的术 ...
2026-03-20在CDA(Certified Data Analyst)数据分析师的全流程工作闭环中,统计制图是连接严谨统计分析与高效业务沟通的关键纽带,更是CDA ...
2026-03-20在MySQL数据库优化中,分区表是处理海量数据的核心手段——通过将大表按分区键(如时间、地域、ID范围)分割为多个独立的小分区 ...
2026-03-19在商业智能与数据可视化领域,同比、环比增长率是分析数据变化趋势的核心指标——同比(YoY)聚焦“长期趋势”,通过当前周期与 ...
2026-03-19在数据分析与建模领域,流传着一句行业共识:“数据决定上限,特征决定下限”。对CDA(Certified Data Analyst)数据分析师而言 ...
2026-03-19机器学习算法工程的核心价值,在于将理论算法转化为可落地、可复用、高可靠的工程化解决方案,解决实际业务中的痛点问题。不同于 ...
2026-03-18在动态系统状态估计与目标跟踪领域,高精度、高鲁棒性的状态感知是机器人导航、自动驾驶、工业控制、目标检测等场景的核心需求。 ...
2026-03-18“垃圾数据进,垃圾结果出”,这是数据分析领域的黄金法则,更是CDA(Certified Data Analyst)数据分析师日常工作中时刻恪守的 ...
2026-03-18在机器学习建模中,决策树模型因其结构直观、易于理解、无需复杂数据预处理等优势,成为分类与回归任务的首选工具之一。而变量重 ...
2026-03-17在数据分析中,卡方检验是一类基于卡方分布的假设检验方法,核心用于分析分类变量之间的关联关系或实际观测分布与理论期望分布的 ...
2026-03-17在数字化转型的浪潮中,企业积累的数据日益庞大且分散——用户数据散落在注册系统、APP日志、客服记录中,订单数据分散在交易平 ...
2026-03-17在数字化时代,数据分析已成为企业决策、业务优化、增长突破的核心支撑,从数据仓库搭建(如维度表与事实表的设计)、数据采集清 ...
2026-03-16在数据仓库建设、数据分析(尤其是用户行为分析、业务指标分析)的实践中,维度表与事实表是两大核心组件,二者相互依存、缺一不 ...
2026-03-16数据是CDA(Certified Data Analyst)数据分析师开展一切工作的核心载体,而数据读取作为数据生命周期的关键环节,是连接原始数 ...
2026-03-16在用户行为分析实践中,很多从业者会陷入一个核心误区:过度关注“当前数据的分析结果”,却忽视了结果的“泛化能力”——即分析 ...
2026-03-13在数字经济时代,用户的每一次点击、浏览、停留、转化,都在传递着真实的需求信号。用户行为分析,本质上是通过收集、整理、挖掘 ...
2026-03-13