京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据在微金融发展中的运用_数据分析师
不仅仅是微金融,大数据在传统金融领域也有巨大潜能。大数据通过获取、分析和解释规模巨大、格式复杂的数据,推动业务价值创造方式的变革,形成全新的洞察。为了充分把握大数据的优势,商业与运营模式需要进行相应的调整与变革。
据统计,金融机构对内部可用信息的使用率仅为34%,还仅限于一些客户基本信息和交易数据。除此之外,还有许多可以利用的数据,有助金融机构提升业务价值,包括:移动银行业务用户的定位数据、社交媒体互动信息、网上搜索行为等。大数据在金融机构客户细分、精准营销、风险管理方面有重大发挥潜力。利用不同维度的数据,进行立体的、多维度的画像,进而更为精准、动态的衡量客户信贷风险。
目前小微融资领域还是以线下融资为主,主要三种模式是银行信贷工厂模式、单人全流程模式、扫街速贷模式,但是最大的缺陷是人力资本较高。然而大数据模式,可以通过对内外部广泛数据源的收集和分析,构建应用模型,大大提升风险准入、审批、定价和监控的自动化程度。识别通常的违约模式,再结合交易和业务活动,就可以开发针对中小企业客户的复杂算法。
【现场实录】
今天中国大数据的时代正在到来,比如7亿用户,3.5亿的微信用户等等,最关键我们看到有8亿的智能连接装置,这些都使得数据作为一项基础设施,作为一项资源,成为了可能。中国的用户相较于欧美来讲,对个人信息来讲更愿意分享,这是我们2014年最近完成的一份调研。问如果我给你一个个性化的产品,你是否愿意分享你的数据。93%的客户会说“我愿意”。如果我给你降价,90%的客户是愿意分享这样的数据。
数据的种类多种多样,百分之六十几的合乎愿意分享家庭类传感器的数据、病例上的数据、汽车传感器上的数据等等。可以看出来中国的用户其实对数据相对于欧美人更愿意分享。这就给我们带来一些机会,有了这样的数据,就会让我们的微金融有一些发展。今天大家在讨论大数据的时候,很多都是在技术层面上,比如说大数据、小数据、快数据、慢数据。但我们觉得大数据的出发点和根源,着眼点、落脚点始终在于价值是否能够为微金融,为其它的商业模式带来价值。
举个例子,像银行的数据并不少,每100万美元收入里,银行业会创造和使用的数据大概是820个,多于其它行业。可是银行在数据的应用上、创造价值上,却是不多的。这是我们一个真实的例子,可用的数据如果是百分之百,大概银行只会收集80%的数据。去到一些质量不好的,可用的大概占到70%,最后真正能够用数据创造价值,大概只占34%。这些都是说有了这样的数据,可是没有应用好,没有带来一些价值。
大数据其实在整个金融机构的价值链上还是很有应用潜在价值。从场景上来讲,比如说像客户细分、精准营销、定价、增值服务、风险管理这几个领域,大数据都有非常好的应用领域。尤其像风险管理上,包括确定违约模式、完善评分、催收、检测以及异常情况的检测等等,这些大数据都能发挥很好的作用。
举个例子,美国一家公司收集纽约所有电梯运行的数据,通过电梯在一个楼层内是否停留的次数的多少,判断这个楼层内这些小企业生意的好坏,以及可能会出现风险的情况。这就是一个可能应用的场景。在这些应用场景上其实都有很多例子。
有了大数据,有了应用场景,可是为什么我们的小微企业目前还是融资难、融资贵?还有很多模式并没有被充分挖掘出来。如果银行体系给小微企业的融资大概提供了12%,银行加上类金融,包括租赁、保险、P2P大概加起来是20%。调研普遍反映时间长、抵押物不充分、没有财务报表、成本较高。之所以出现这些问题,主要是目前小微金融的模式还是以线下为主体。目前在小微领域上主要的三种模式,信贷工厂模式、IPC模式、扫街模式。IPC模式,单人全流程,基本上能够把单笔的授信模式降到100万到200万之间。第三种扫街模式,基本上属于设置较高的定价来覆盖,主要是属于信用模式。这三个模式都有一个特点,基本上都是人力耗费比较大、成本比较高、难以规模化推广。这是目前我们看到的主要的几种模式。
大数据多样化的数据来源,为构建小微体系成功可能。包括社交数据、物流数据、支付数据、交易平台的数据、点评的数据,都可以极大地丰富我们对于风险的准入、评估、定价以及监控、效率。
大数据跟传统风控的差别比较大,包括数据的维度、格式、来源、分析方法都存在比较大的差别。传统我们做风险评估的时候主要是基于评分塔,最主要依赖企业的财务数据和金融体系的信贷数据。逻辑回归,找出主要的因子变量是一个主要的方法。主要是依靠比较好的变量个数,但是要求变量数据非常精准。大数据主要应用的是网络和一些非金融征信的数据,包括结构化的数据,也包括非结构化的数据。包括主要采用机器学习,不断总结这些数据之间的内在关系,变量有几千万个。这些变量里收集数据的质量可以不准确,可以千差万别。当有几千到一万个数据的时候,一个完整、精确的对一个客户的描述就会呈现出来。
这是一个“饿了么”的网站,对小餐馆是一个非常好的信用评价,这些小餐馆并没有什么固定资产和财务报表,但是这里有对它的整体评价,对它客流量的评价,对它质量的评价,对它未来一段时间内整个生意的经营好坏,都会有些预测。基于这样的数据,其实就可以对一个餐馆做出一定程度上的风险判断。
我们也看到一些公司在利用多维的动态数据对人进行360度的描绘。传统方式上,我们在金融机构理解一个客户,这个客户的身份、经济实力、财务状况、违约历史,这是我们主要要看的。但是如果我们通过把互联网上的数据抓到一起,就会更生动地刻画出这个人的基础信息、社交信息、基础爱好、生活习惯、消费习惯等等,会为整个大数据体系下的征信和风险评估奠定一个很好的基础。
一些公司在这方面已经做出了一些实践,包括ZestFinance,前两天它的CEO也来中国做了演讲。它主要收集第三方的数据、用户的数据以及互联网的数据。它通过这些数据把一个人大概能有一千到一万以上的描述,通过这些细节的数据,可以很生动、很立体地描绘出一个人。有一句话讲得蛮有意思:没有数据本身也是一种信息。当一个人要收集一万项,这个人只能提供一千项,缺九千项,这个人本身就能提供很好的信息。这在美国算是比较成功的一个利用大数据做风险评估的公司,但是它的数据最大程度上其实依靠的主要是第三方的数据,包括搬家、法律、电话、联系、水电,对社交数据运用得并不多。
SCOR的例子,一般来讲银行如果一个客户做一个评价的时候,银行会使用三大征信的信息,SCOR的信息作为最后补充。SCOR会收集你在facebook、twitter上的数据,作为银行发放信用的一个补充性的信息。、Kabbage这是纯做网络信贷的企业。美国的很多商家其实是多平台上做操作,有的是在Ebay、雅虎等几个电商平台上,单个平台上交易量的信息都不能保证他们获得很好的授信,Kabbage会把不同平台上的数据,物流的数据、社交平台的数据整合在一起,提供一个更加全面的图谱,提供整个风险和评价。
还有像欧洲的银行,应用的会相对保守一些,但是他们也正在用很多大数据的理念完善他们的风控体系。比如这是西班牙第二大银行,通过违约跟不同变量之间的关系做大量的运算,找出来关键的变量。比如说一个小的企业在多个地方的运营,违约率是会比较高的。一个小的企业用信用卡的交易量是比较多的,可靠性也会比较多。通过大量回归性的学习,不断找出违约关键的变量。
中国的拍拍贷这样的公司,也开始这样的探索和尝试。
用大数据解决小微金融的问题,有几个方面是非常关键的,包括数据的使用、数据的计算以及生态系统。其中我们重点强调有三点:第一,中国是比较急需一个对于消费者数据保护的法规。如果双方有契约,使用消费者的数据会有更大范围以及更加可靠的来源,建立互信。第二,很多金融机构包括互联网金融企业在数据的获取管理和解读上非常缺乏人才,尤其缺乏既懂得业务又懂得技术的数据科学家。第三,中国目前整个互联网的发展其实蛮有活力,应该说全球最有活力,但是对于整个数据生态系统的描述不是很全面。像我们在一些国家帮助绘制的描述整个数据生态系统,包括营销用的数据生态系统、风控用的数据生态系统,我们在中国还没有看到完整的图谱,这是比较需要的。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在实验检测、质量控制、科研验证等场景中,“方法验证”是确保检测/分析结果可靠、可复用的核心环节——无论是新开发的检测方法 ...
2026-03-04在数据分析、科研实验、办公统计等场景中,我们常常需要对比两组数据的整体差异——比如两种营销策略的销售额差异、两种实验方案 ...
2026-03-04在数字化转型进入深水区的今天,企业对数据的依赖程度日益加深,而数据治理体系则是企业实现数据规范化、高质量化、价值化的核心 ...
2026-03-04在深度学习,尤其是卷积神经网络(CNN)的实操中,转置卷积(Transposed Convolution)是一个高频应用的操作——它核心用于实现 ...
2026-03-03在日常办公、数据分析、金融理财、科研统计等场景中,我们经常需要计算“平均值”来概括一组数据的整体水平——比如计算月度平均 ...
2026-03-03在数字化转型的浪潮中,数据已成为企业最核心的战略资产,而数据治理则是激活这份资产价值的前提——没有规范、高质量的数据治理 ...
2026-03-03在Excel办公中,数据透视表是汇总、分析繁杂数据的核心工具,我们常常通过它快速得到销售额汇总、人员统计、业绩分析等关键结果 ...
2026-03-02在日常办公和数据分析中,我们常常需要探究两个或多个数据之间的关联关系——比如销售额与广告投入是否正相关、员工出勤率与绩效 ...
2026-03-02在数字化运营中,时间序列数据是CDA(Certified Data Analyst)数据分析师最常接触的数据类型之一——每日的营收、每小时的用户 ...
2026-03-02在日常办公中,数据透视表是Excel、WPS等表格工具中最常用的数据分析利器——它能快速汇总繁杂数据、挖掘数据关联、生成直观报表 ...
2026-02-28有限元法(Finite Element Method, FEM)作为工程数值模拟的核心工具,已广泛应用于机械制造、航空航天、土木工程、生物医学等多 ...
2026-02-28在数字化时代,“以用户为中心”已成为企业运营的核心逻辑,而用户画像则是企业读懂用户、精准服务用户的关键载体。CDA(Certifi ...
2026-02-28在Python面向对象编程(OOP)中,类方法是构建模块化、可复用代码的核心载体,也是实现封装、继承、多态特性的关键工具。无论是 ...
2026-02-27在MySQL数据库优化中,索引是提升查询效率的核心手段—— 面对千万级、亿级数据量,合理创建索引能将查询时间从秒级压缩到毫秒级 ...
2026-02-27在数字化时代,企业积累的海量数据如同散落的珍珠,若缺乏有效的梳理与分类,终将难以发挥实际价值。CDA(Certified Data Analys ...
2026-02-27在问卷调研中,我们常遇到这样的场景:针对同一批调查对象,在不同时间点(如干预前、干预后、随访期)发放相同或相似的问卷,收 ...
2026-02-26在销售管理的实操场景中,“销售机会”是核心抓手—— 从潜在客户接触到最终成交,每一个环节都藏着业绩增长的关键,也暗藏着客 ...
2026-02-26在CDA数据分析师的日常工作中,数据提取、整理、加工是所有分析工作的起点,而“创建表”与“创建视图”,则是数据库操作中最基 ...
2026-02-26在机器学习分析、数据决策的全流程中,“数据质量决定分析价值”早已成为行业共识—— 正如我们此前在运用机器学习进行分析时强 ...
2026-02-25在数字化时代,数据已成为企业决策、行业升级的核心资产,但海量杂乱的原始数据本身不具备价值—— 只有通过科学的分析方法,挖 ...
2026-02-25