京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据在微金融发展中的运用_数据分析师
不仅仅是微金融,大数据在传统金融领域也有巨大潜能。大数据通过获取、分析和解释规模巨大、格式复杂的数据,推动业务价值创造方式的变革,形成全新的洞察。为了充分把握大数据的优势,商业与运营模式需要进行相应的调整与变革。
据统计,金融机构对内部可用信息的使用率仅为34%,还仅限于一些客户基本信息和交易数据。除此之外,还有许多可以利用的数据,有助金融机构提升业务价值,包括:移动银行业务用户的定位数据、社交媒体互动信息、网上搜索行为等。大数据在金融机构客户细分、精准营销、风险管理方面有重大发挥潜力。利用不同维度的数据,进行立体的、多维度的画像,进而更为精准、动态的衡量客户信贷风险。
目前小微融资领域还是以线下融资为主,主要三种模式是银行信贷工厂模式、单人全流程模式、扫街速贷模式,但是最大的缺陷是人力资本较高。然而大数据模式,可以通过对内外部广泛数据源的收集和分析,构建应用模型,大大提升风险准入、审批、定价和监控的自动化程度。识别通常的违约模式,再结合交易和业务活动,就可以开发针对中小企业客户的复杂算法。
【现场实录】
今天中国大数据的时代正在到来,比如7亿用户,3.5亿的微信用户等等,最关键我们看到有8亿的智能连接装置,这些都使得数据作为一项基础设施,作为一项资源,成为了可能。中国的用户相较于欧美来讲,对个人信息来讲更愿意分享,这是我们2014年最近完成的一份调研。问如果我给你一个个性化的产品,你是否愿意分享你的数据。93%的客户会说“我愿意”。如果我给你降价,90%的客户是愿意分享这样的数据。
数据的种类多种多样,百分之六十几的合乎愿意分享家庭类传感器的数据、病例上的数据、汽车传感器上的数据等等。可以看出来中国的用户其实对数据相对于欧美人更愿意分享。这就给我们带来一些机会,有了这样的数据,就会让我们的微金融有一些发展。今天大家在讨论大数据的时候,很多都是在技术层面上,比如说大数据、小数据、快数据、慢数据。但我们觉得大数据的出发点和根源,着眼点、落脚点始终在于价值是否能够为微金融,为其它的商业模式带来价值。
举个例子,像银行的数据并不少,每100万美元收入里,银行业会创造和使用的数据大概是820个,多于其它行业。可是银行在数据的应用上、创造价值上,却是不多的。这是我们一个真实的例子,可用的数据如果是百分之百,大概银行只会收集80%的数据。去到一些质量不好的,可用的大概占到70%,最后真正能够用数据创造价值,大概只占34%。这些都是说有了这样的数据,可是没有应用好,没有带来一些价值。
大数据其实在整个金融机构的价值链上还是很有应用潜在价值。从场景上来讲,比如说像客户细分、精准营销、定价、增值服务、风险管理这几个领域,大数据都有非常好的应用领域。尤其像风险管理上,包括确定违约模式、完善评分、催收、检测以及异常情况的检测等等,这些大数据都能发挥很好的作用。
举个例子,美国一家公司收集纽约所有电梯运行的数据,通过电梯在一个楼层内是否停留的次数的多少,判断这个楼层内这些小企业生意的好坏,以及可能会出现风险的情况。这就是一个可能应用的场景。在这些应用场景上其实都有很多例子。
有了大数据,有了应用场景,可是为什么我们的小微企业目前还是融资难、融资贵?还有很多模式并没有被充分挖掘出来。如果银行体系给小微企业的融资大概提供了12%,银行加上类金融,包括租赁、保险、P2P大概加起来是20%。调研普遍反映时间长、抵押物不充分、没有财务报表、成本较高。之所以出现这些问题,主要是目前小微金融的模式还是以线下为主体。目前在小微领域上主要的三种模式,信贷工厂模式、IPC模式、扫街模式。IPC模式,单人全流程,基本上能够把单笔的授信模式降到100万到200万之间。第三种扫街模式,基本上属于设置较高的定价来覆盖,主要是属于信用模式。这三个模式都有一个特点,基本上都是人力耗费比较大、成本比较高、难以规模化推广。这是目前我们看到的主要的几种模式。
大数据多样化的数据来源,为构建小微体系成功可能。包括社交数据、物流数据、支付数据、交易平台的数据、点评的数据,都可以极大地丰富我们对于风险的准入、评估、定价以及监控、效率。
大数据跟传统风控的差别比较大,包括数据的维度、格式、来源、分析方法都存在比较大的差别。传统我们做风险评估的时候主要是基于评分塔,最主要依赖企业的财务数据和金融体系的信贷数据。逻辑回归,找出主要的因子变量是一个主要的方法。主要是依靠比较好的变量个数,但是要求变量数据非常精准。大数据主要应用的是网络和一些非金融征信的数据,包括结构化的数据,也包括非结构化的数据。包括主要采用机器学习,不断总结这些数据之间的内在关系,变量有几千万个。这些变量里收集数据的质量可以不准确,可以千差万别。当有几千到一万个数据的时候,一个完整、精确的对一个客户的描述就会呈现出来。
这是一个“饿了么”的网站,对小餐馆是一个非常好的信用评价,这些小餐馆并没有什么固定资产和财务报表,但是这里有对它的整体评价,对它客流量的评价,对它质量的评价,对它未来一段时间内整个生意的经营好坏,都会有些预测。基于这样的数据,其实就可以对一个餐馆做出一定程度上的风险判断。
我们也看到一些公司在利用多维的动态数据对人进行360度的描绘。传统方式上,我们在金融机构理解一个客户,这个客户的身份、经济实力、财务状况、违约历史,这是我们主要要看的。但是如果我们通过把互联网上的数据抓到一起,就会更生动地刻画出这个人的基础信息、社交信息、基础爱好、生活习惯、消费习惯等等,会为整个大数据体系下的征信和风险评估奠定一个很好的基础。
一些公司在这方面已经做出了一些实践,包括ZestFinance,前两天它的CEO也来中国做了演讲。它主要收集第三方的数据、用户的数据以及互联网的数据。它通过这些数据把一个人大概能有一千到一万以上的描述,通过这些细节的数据,可以很生动、很立体地描绘出一个人。有一句话讲得蛮有意思:没有数据本身也是一种信息。当一个人要收集一万项,这个人只能提供一千项,缺九千项,这个人本身就能提供很好的信息。这在美国算是比较成功的一个利用大数据做风险评估的公司,但是它的数据最大程度上其实依靠的主要是第三方的数据,包括搬家、法律、电话、联系、水电,对社交数据运用得并不多。
SCOR的例子,一般来讲银行如果一个客户做一个评价的时候,银行会使用三大征信的信息,SCOR的信息作为最后补充。SCOR会收集你在facebook、twitter上的数据,作为银行发放信用的一个补充性的信息。、Kabbage这是纯做网络信贷的企业。美国的很多商家其实是多平台上做操作,有的是在Ebay、雅虎等几个电商平台上,单个平台上交易量的信息都不能保证他们获得很好的授信,Kabbage会把不同平台上的数据,物流的数据、社交平台的数据整合在一起,提供一个更加全面的图谱,提供整个风险和评价。
还有像欧洲的银行,应用的会相对保守一些,但是他们也正在用很多大数据的理念完善他们的风控体系。比如这是西班牙第二大银行,通过违约跟不同变量之间的关系做大量的运算,找出来关键的变量。比如说一个小的企业在多个地方的运营,违约率是会比较高的。一个小的企业用信用卡的交易量是比较多的,可靠性也会比较多。通过大量回归性的学习,不断找出违约关键的变量。
中国的拍拍贷这样的公司,也开始这样的探索和尝试。
用大数据解决小微金融的问题,有几个方面是非常关键的,包括数据的使用、数据的计算以及生态系统。其中我们重点强调有三点:第一,中国是比较急需一个对于消费者数据保护的法规。如果双方有契约,使用消费者的数据会有更大范围以及更加可靠的来源,建立互信。第二,很多金融机构包括互联网金融企业在数据的获取管理和解读上非常缺乏人才,尤其缺乏既懂得业务又懂得技术的数据科学家。第三,中国目前整个互联网的发展其实蛮有活力,应该说全球最有活力,但是对于整个数据生态系统的描述不是很全面。像我们在一些国家帮助绘制的描述整个数据生态系统,包括营销用的数据生态系统、风控用的数据生态系统,我们在中国还没有看到完整的图谱,这是比较需要的。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
逻辑回归是数据分析、机器学习、统计建模中应用最广泛的二分类预测模型,常用于风险判断、行为预测、归因分析等场景。在SPSS、Py ...
2026-06-02数字经济时代,市场竞争日趋同质化,用户消费需求愈发个性化、多元化,传统依托经验、粗放式、广撒网的营销模式弊端日益凸显。长 ...
2026-06-02 很多数据分析师做过按月份的销售额趋势图,画过按天的流量折线图,但当被问到“时间序列和普通数据有什么本质区别”“季节性 ...
2026-06-02在市场竞争日趋饱和、用户需求不断细分的当下,企业创业创新、产品迭代与市场拓展不再依赖经验决策,而是需要系统化、工具化的商 ...
2026-06-01【核心关键词】调度、岗位、数据库、企业、报表、培训、程序、数据分析、数据加工、业务部门、企业数据、调度工具、业务指标、 ...
2026-06-01 很多数据分析师能熟练地计算指标、搭建标签体系,但当被问到“画像到底在解决什么问题”“画像和标签是什么关系”“画像如何 ...
2026-06-01在数据统计分析、数据清洗、异常值识别与数据分布研究中,箱型图是最直观、高效、专业的可视化分析工具。相较于柱状图、折线图仅 ...
2026-05-29Tkinter是Python内置的标准GUI图形界面库,具备无需额外安装、调用简单、兼容性强、轻量化高效等优势,是Python快速开发桌面小程 ...
2026-05-29 很多分析师在设计标签时思路清晰,但真到落地环节却面临“数据在手,不知如何转化为可用标签”的困境:或因加工方式选择不当 ...
2026-05-29【核心关键词】大数据、经理、专业、金融、客户、传统、建模、数据产品、互联网金融、产品经理、数据分析、金融行业、数据模型 ...
2026-05-28 很多分析师每天和数据打交道,但当被问到“标签是什么”“标签和指标有什么区别”“标签体系如何设计”时,却常常答不上来。 ...
2026-05-28随着大数据技术的快速普及,各行各业积累了海量的用户数据、交易数据、生产数据与行为数据。单纯的数据统计与报表分析只能呈现表 ...
2026-05-28在Python网络请求、接口测试、数据爬取、业务对接开发中,Requests库是最简洁、最高效的HTTP请求工具,凭借简洁的语法、完善的适 ...
2026-05-272025 年,零售与服务行业的竞争已从 “经验驱动” 全面转向 “数据驱动”。中小企业门店普遍面临数据零散、分析浅层、决策凭感觉 ...
2026-05-27 很多数据分析师每天都在写SQL,但当被问到“数据查询语言(DQL)的本质是什么”“SELECT语句中各子句的书写顺序与实际执行顺 ...
2026-05-27在统计学分析、实验研究、业务数据复盘过程中,单因素方差分析是检验自变量对因变量是否存在显著影响的核心方法。其中,两个水平 ...
2026-05-26【核心关键词】算法、客户、大数据、互联网、调优、建模、模型优化、机器学习、评分卡模型、模型开发、智能风控、业务场景、数 ...
2026-05-26 很多数据分析师写过无数个 SELECT,但当被问到“新建一张表,该如何定义字段类型来保证数据质量”“创建视图和存储物理表有 ...
2026-05-26在数据清洗、统计分析与数据质量检测工作中,箱型图(又称箱线图、Box Plot)是最直观、最高效的可视化分析工具之一。相较于柱状 ...
2026-05-25在大数据分析、数据清洗、质量管控、风险监测等领域,异常数据识别是保障数据质量、确保分析结论精准、规避业务决策失误的核心基 ...
2026-05-25