京公网安备 11010802034615号
经营许可证编号:京B2-20210330
深圳金融平台“暗战”大数据风控_数据分析师
近日,针对5万元以下的个人信用贷款申请,在线金融搜索服务融360开始悄然使用了一个名为“天机”的风控系统,会根据身份认证、还款意愿和还款能力三个维度,给申请贷款的用户进行信用评分,并决定是否放款。而腾讯的微众银行则依托腾讯在社交数据方面的强大优势,汇集了40万亿条数据信息,形成微众银行的大数据系统,这样微众不需要调查信用、上门担保,实现整个服务完全依托于互联网。
业内人士指出,基于大数据的风控模型正在成为互联网金融领域的一个热门战场,这是因为谁在这个领域实现突破,谁就将制胜下一步互联网金融市场。
趋势
大数据风控成互联网金融争抢高地
在线金融搜索平台融360CEO叶大清介绍,针对5万元以下的个人信用贷款申请,融360已开始使用一个名为“天机”的风控系统。这个系统包含一组模型,会根据身份认证、还款意愿和还款能力三个大维度,给申请贷款的用户进行信用评分,依据分值来决定是否放款。
该风控系统主要用于某些小额贷款业务。基于借款申请人自主提交的个人数据,可以做到10分钟左右完成审批。5万元以下的小额贷款申请,10分钟完成审批,最快当天放款。相比而言,人工审核一般需要一周以上才能放款,慢的可能两个月。
叶大清表示,“这些线上的小额贷款业务,背后的个人信用审核完全由风控系统自动完成,这意味着贷款在线化有望在短时间内得到大规模普及。”
融360负责风控业务的副总裁李英浩表示,大数据风控是一个需要不断完善优化的过程,市场上并没有标准的解决方案,因此采取开放合作的态度很重要。李英浩透露:“芝麻信用和融360在模型和产品方面正在就深入合作进行探讨。”
作为金融垂直搜索服务,融360过去3年半积累了大量信贷用户数据,帮助用户成功获取了超过3000亿元贷款。在借款人访问数据、用户申请资质信息、网站行为数据、批贷信息和贷后信息方面也有优势。
事实上,融360并非第一家在大数据风控系统上发力的互联网金融企业。马化腾的腾讯征信有限公司、马明哲的中国平安旗下的前海征信大都是通过大数据来进行风险控制;而蚂蚁金服旗下的芝麻信用、一些P2P网贷平台都在陆续研发大数据信用评估模型。
目前,大数据风控最有条件的仍然是阿里和腾讯。阿里推出了面向社会的信用服务体系芝麻信用,除了接入阿里的电商数据和蚂蚁金服的互联网金融数据外,还与外部的公共机构、商业机构达成广泛的合作。腾讯掌握着基于微信的社交信息数据,也即将推出自己的大数据征信。
显而易见,大数据风控正在成为几乎所有互联网金融平台争相抢占的一个市场高地。
数据
大数据筛选用户 逾期率低一半
多年来,金融机构很大程度上都依赖于央行征信报告来决定是否给个人客户授信。但13亿人中有10亿人并没有信贷记录,加之个人客户往往是贷款额度小、需求分散、个性化需求多,使得大多传统银行想做零售贷款而力不从心。
“因获客、评估、审核和风控都靠人工,传统银行的运营成本过高,面对广大个人消费者这一潜在客户群,银行只能望洋兴叹。”叶大清表示:“互联网金融的核心竞争力并不是营销获客能力,而是大数据风控能力。即借助于大数据,让那些在央行征信系统没有信用记录的个人消费者和小微企业主也有可能申请到贷款。”
叶大清告诉记者,事实上,追溯到十几年前,在线贷款在美国等发达国家已开始普及,香港也早早实现类似的线上小额贷款业务。“直到近两年,我国才有了P2P、微众银行这样的在线贷款机构,但相比国外,已晚了近20年。为什么呢?主要是由于我们的大数据缺失,征信机构一直以来也只有央行一家,金融机构的风险控制能力和贷款定价能力也随之降低。”
一方面,我国的征信机构少、大数据风控系统缺失,另一方面,信贷市场非常庞大。数据显示,我国零售金融规模已达到百万亿,其中零售金融以房贷、车贷、消费金融、信用卡为主体,而互联网金融只占零售金融的1%不到。
“中国的消费金融市场属于万亿级别,互联网金融只占零售金融的1%不到,想想这个空间有多大。”叶大清指出,“在线贷款的突破口,就是大数据风控。使用大数据风控模型后,不仅贷款审批速度实现了突破,贷款获批率也得到了大幅提升。”
来自融360的数据显示,同一类用户,用抵押物、收入流水证明等粗放式的传统风控方式,贷款获批率在15%左右,而使用大数据模型结合人工后获批率可以达到30%以上。至于贷款的逾期率,以12个月违约风险举例,通过大数据风控模型筛选的用户,逾期率比没有经过筛选的低一半。
揭秘
用户上网痕迹均纳入信用评估
业内人士指出,大数据风控系统之所以成为可能,是因为每个人在网上留下的数据痕迹,通过大数据的智能化分析和预测技术,借此判断一个人的信用风险。
不少人对李克强总理新年伊始来到深圳微众银行考察的场面印象深刻。当天,李克强总理在电脑键盘上敲击了一下回车键,很快,终端机吐出了一张小小的“借据”,一笔3.5万元的贷款发放完成。在这项贷款过程中,贷款人通过摄像头对准脸部,软件系统识别出身份,与公安部身份数据进行匹配,在“刷脸”认证的同时,通过社交媒体等大数据分析,软件对贷款人的信用进行评定,从而计算出贷款金额。
业内人士指出,微众银行使用的“刷脸”认证,背后依靠的正是腾讯社交平台积累的大数据风控模型,其应用的是快速场景归类,通过建立不同的场景简化繁琐的流程,加快审批速度。
作为一家定位为专业征信机构的第三方征信平台,中国平安旗下的前海征信同样非常重视数据分析。据悉,担纲前海征信总经理的邱寒,曾先后在GE、麦肯锡、新加坡淡马锡等公司担任重要管理职务,是一位拥有多年数据分析、风险管理经验的综合性国际化金融人才。对她的任命,体现了前海征信重视大数据分析的基因。
记者了解到,目前,前海征信建立最多的是借贷场景。邱寒表示,从风控的角度来说,无论是来自于传统金融行业的信贷、偿付能力等信用算法,抑或是互联网时代的购买行为、社交行为等大数据算法,前海征信都会尝试。
据叶大清介绍,融360正在广泛收集数据、并深入挖掘数据中衍生的特征,这些特征会被分类成多个维度,如风险特征、用户偏好、用户意愿、用户属性等。通过丰富的用户特征,融360综合应用传统金融模型和机器学习模型,搭建整体大数据风控系统的架构,并通过模型构建贷款推荐、风险预测、实时定价等一系列应用服务产品。
用户在互联网上留下的足迹有社交媒体上的动态、电商消费行为、网站浏览痕迹。李英浩告诉记者,通过风控模型的梳理和分析,就能得出有关贷款行为的需求、申请什么类型贷款、申请金额,逾期及违约的可能性等结论,这构成了对个人用户进行信用风险评估。“但用户看不到自己的信用分值,只能看到最终获批的额度、利率和期限。”
难点
大数据未实现互联互通是瓶颈
央行在新年上班后的第二天就宣布8家机构获准开展个人征信业务,此举被看作是央行个人征信市场化的放开。
记者采访了解到,对征信公司而言,大数据是重要的工作模块,通过大数据建立不同的模型场景,最终构建起独具特色的风险管理能力和风险建模能力。
各家互联网金融机构都在构建自己的大数据风控系统,一些互联网金融企业还形成了鲜明的大数据风控特色。以微众银行为例,该银行的大数据系统,依托腾讯在社交数据方面的强大优势,汇集了40万亿条数据信息,因此银行不需要调查信用、上门担保,整个服务完全依托于互联网。
分析人士指出,基于现代通信技术和大数据的互联网金融产品可能更加个性化、更有针对性,能够通过大数据风控系统精准判断和选择客户,为客户提供更多的选择机会。
不过,对于大数据征信的可靠性,目前市场各方存在广泛争议。有银行业风控方面人士表示,通过社交网络等渠道形成的征信方法和数据未必能全部符合传统商业银行的监管要求。相比绑定真实交易以及个人金融服务业务的传统金融机构而言,互联网企业数据部分可能存在失真,不少社交或金融交易数据可以通过各类渠道修改或造假。因此,如何防范金融诈骗等风险问题,也将是微众银行需要考虑的重要问题。
同样,银行的网络贷款也存在造假风险。虽然POS机积累的商户流水量、反映的商户经营状况等为银行信贷提供了依据,不过同样也存在流水造假等风险。
针对这些问题,叶大清分析认为,大数据风控系统是互联网金融最核心的竞争力已毋庸置疑,但在现实层面的操作中,也存在一些瓶颈:一是门槛高,大数据风控系统的构建需要专业的人才、技术和时间的积累;其二,目前我国的大数据风控系统还没有实现互通互联,阿里、银联、平安、腾讯以及众多的P2P公司,都是各自为政,P2P公司拿不到央行的数据,几家大的互联网平台在相关大数据的分享上彼此也未通有无。
“应该说,各家的大数据都各有优劣,如何实现优势互补,让大数据能全面、真实、客观地反映出个人或企业的真实征信水平?如何更精准的控制风险达到反欺诈的目的?大数据很重要,但更重要的是能够分享,封闭的平台一定会有问题。”叶大清指出:“做大数据风控模型一定有开放的心态,如果腾讯、阿里和平安的征信数据都打通,大家能共享大数据,一定可以把征信风险降到最低。”
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在回归分析的结果解读中,R方(决定系数)是衡量模型拟合效果的核心指标——它代表因变量的变异中能被自变量解释的比例,取值通 ...
2025-12-04在城市规划、物流配送、文旅分析等场景中,经纬度热力图是解读空间数据的核心工具——它能将零散的GPS坐标(如外卖订单地址、景 ...
2025-12-04在CDA(Certified Data Analyst)数据分析师的指标体系中,“通用指标”与“场景指标”并非相互割裂的两个部分,而是支撑业务分 ...
2025-12-04每到“双十一”,电商平台的销售额会迎来爆发式增长;每逢冬季,北方的天然气消耗量会显著上升;每月的10号左右,工资发放会带动 ...
2025-12-03随着数字化转型的深入,企业面临的数据量呈指数级增长——电商的用户行为日志、物联网的传感器数据、社交平台的图文视频等,这些 ...
2025-12-03在CDA(Certified Data Analyst)数据分析师的工作体系中,“指标”是贯穿始终的核心载体——从“销售额环比增长15%”的业务结论 ...
2025-12-03在神经网络训练中,损失函数的数值变化常被视为模型训练效果的“核心仪表盘”——初学者盯着屏幕上不断下降的损失值满心欢喜,却 ...
2025-12-02在CDA(Certified Data Analyst)数据分析师的日常工作中,“用部分数据推断整体情况”是高频需求——从10万条订单样本中判断全 ...
2025-12-02在数据预处理的纲量统一环节,标准化是消除量纲影响的核心手段——它将不同量级的特征(如“用户年龄”“消费金额”)转化为同一 ...
2025-12-02在数据驱动决策成为企业核心竞争力的今天,A/B测试已从“可选优化工具”升级为“必选验证体系”。它通过控制变量法构建“平行实 ...
2025-12-01在时间序列预测任务中,LSTM(长短期记忆网络)凭借对时序依赖关系的捕捉能力成为主流模型。但很多开发者在实操中会遇到困惑:用 ...
2025-12-01引言:数据时代的“透视镜”与“掘金者” 在数字经济浪潮下,数据已成为企业决策的核心资产,而CDA数据分析师正是挖掘数据价值的 ...
2025-12-01数据分析师的日常,常始于一堆“毫无章法”的数据点:电商后台导出的零散订单记录、APP埋点收集的无序用户行为日志、传感器实时 ...
2025-11-28在MySQL数据库运维中,“query end”是查询执行生命周期的收尾阶段,理论上耗时极短——主要完成结果集封装、资源释放、事务状态 ...
2025-11-28在CDA(Certified Data Analyst)数据分析师的工具包中,透视分析方法是处理表结构数据的“瑞士军刀”——无需复杂代码,仅通过 ...
2025-11-28在统计分析中,数据的分布形态是决定“用什么方法分析、信什么结果”的底层逻辑——它如同数据的“性格”,直接影响着描述统计的 ...
2025-11-27在电商订单查询、用户信息导出等业务场景中,技术人员常面临一个选择:是一次性查询500条数据,还是分5次每次查询100条?这个问 ...
2025-11-27对数据分析从业者和学生而言,表结构数据是最基础也最核心的分析载体——CRM系统的用户表、门店的销售明细表、仓库的库存表,都 ...
2025-11-27在业务数据可视化中,热力图(Heat Map)是传递“数据密度与分布特征”的核心工具——它通过颜色深浅直观呈现数据值的高低,让“ ...
2025-11-26在企业数字化转型中,业务数据分析师是连接数据与决策的核心纽带。但“数据分析师”并非单一角色,从初级到高级,其职责边界、能 ...
2025-11-26