
大数据在微金融发展中的运用_数据分析师
不仅仅是微金融,大数据在传统金融领域也有巨大潜能。大数据通过获取、分析和解释规模巨大、格式复杂的数据,推动业务价值创造方式的变革,形成全新的洞察。为了充分把握大数据的优势,商业与运营模式需要进行相应的调整与变革。
据统计,金融机构对内部可用信息的使用率仅为34%,还仅限于一些客户基本信息和交易数据。除此之外,还有许多可以利用的数据,有助金融机构提升业务价值,包括:移动银行业务用户的定位数据、社交媒体互动信息、网上搜索行为等。大数据在金融机构客户细分、精准营销、风险管理方面有重大发挥潜力。利用不同维度的数据,进行立体的、多维度的画像,进而更为精准、动态的衡量客户信贷风险。
目前小微融资领域还是以线下融资为主,主要三种模式是银行信贷工厂模式、单人全流程模式、扫街速贷模式,但是最大的缺陷是人力资本较高。然而大数据模式,可以通过对内外部广泛数据源的收集和分析,构建应用模型,大大提升风险准入、审批、定价和监控的自动化程度。识别通常的违约模式,再结合交易和业务活动,就可以开发针对中小企业客户的复杂算法。
【现场实录】
今天中国大数据的时代正在到来,比如7亿用户,3.5亿的微信用户等等,最关键我们看到有8亿的智能连接装置,这些都使得数据作为一项基础设施,作为一项资源,成为了可能。中国的用户相较于欧美来讲,对个人信息来讲更愿意分享,这是我们2014年最近完成的一份调研。问如果我给你一个个性化的产品,你是否愿意分享你的数据。93%的客户会说“我愿意”。如果我给你降价,90%的客户是愿意分享这样的数据。
数据的种类多种多样,百分之六十几的合乎愿意分享家庭类传感器的数据、病例上的数据、汽车传感器上的数据等等。可以看出来中国的用户其实对数据相对于欧美人更愿意分享。这就给我们带来一些机会,有了这样的数据,就会让我们的微金融有一些发展。今天大家在讨论大数据的时候,很多都是在技术层面上,比如说大数据、小数据、快数据、慢数据。但我们觉得大数据的出发点和根源,着眼点、落脚点始终在于价值是否能够为微金融,为其它的商业模式带来价值。
举个例子,像银行的数据并不少,每100万美元收入里,银行业会创造和使用的数据大概是820个,多于其它行业。可是银行在数据的应用上、创造价值上,却是不多的。这是我们一个真实的例子,可用的数据如果是百分之百,大概银行只会收集80%的数据。去到一些质量不好的,可用的大概占到70%,最后真正能够用数据创造价值,大概只占34%。这些都是说有了这样的数据,可是没有应用好,没有带来一些价值。
大数据其实在整个金融机构的价值链上还是很有应用潜在价值。从场景上来讲,比如说像客户细分、精准营销、定价、增值服务、风险管理这几个领域,大数据都有非常好的应用领域。尤其像风险管理上,包括确定违约模式、完善评分、催收、检测以及异常情况的检测等等,这些大数据都能发挥很好的作用。
举个例子,美国一家公司收集纽约所有电梯运行的数据,通过电梯在一个楼层内是否停留的次数的多少,判断这个楼层内这些小企业生意的好坏,以及可能会出现风险的情况。这就是一个可能应用的场景。在这些应用场景上其实都有很多例子。
有了大数据,有了应用场景,可是为什么我们的小微企业目前还是融资难、融资贵?还有很多模式并没有被充分挖掘出来。如果银行体系给小微企业的融资大概提供了12%,银行加上类金融,包括租赁、保险、P2P大概加起来是20%。调研普遍反映时间长、抵押物不充分、没有财务报表、成本较高。之所以出现这些问题,主要是目前小微金融的模式还是以线下为主体。目前在小微领域上主要的三种模式,信贷工厂模式、IPC模式、扫街模式。IPC模式,单人全流程,基本上能够把单笔的授信模式降到100万到200万之间。第三种扫街模式,基本上属于设置较高的定价来覆盖,主要是属于信用模式。这三个模式都有一个特点,基本上都是人力耗费比较大、成本比较高、难以规模化推广。这是目前我们看到的主要的几种模式。
大数据多样化的数据来源,为构建小微体系成功可能。包括社交数据、物流数据、支付数据、交易平台的数据、点评的数据,都可以极大地丰富我们对于风险的准入、评估、定价以及监控、效率。
大数据跟传统风控的差别比较大,包括数据的维度、格式、来源、分析方法都存在比较大的差别。传统我们做风险评估的时候主要是基于评分塔,最主要依赖企业的财务数据和金融体系的信贷数据。逻辑回归,找出主要的因子变量是一个主要的方法。主要是依靠比较好的变量个数,但是要求变量数据非常精准。大数据主要应用的是网络和一些非金融征信的数据,包括结构化的数据,也包括非结构化的数据。包括主要采用机器学习,不断总结这些数据之间的内在关系,变量有几千万个。这些变量里收集数据的质量可以不准确,可以千差万别。当有几千到一万个数据的时候,一个完整、精确的对一个客户的描述就会呈现出来。
这是一个“饿了么”的网站,对小餐馆是一个非常好的信用评价,这些小餐馆并没有什么固定资产和财务报表,但是这里有对它的整体评价,对它客流量的评价,对它质量的评价,对它未来一段时间内整个生意的经营好坏,都会有些预测。基于这样的数据,其实就可以对一个餐馆做出一定程度上的风险判断。
我们也看到一些公司在利用多维的动态数据对人进行360度的描绘。传统方式上,我们在金融机构理解一个客户,这个客户的身份、经济实力、财务状况、违约历史,这是我们主要要看的。但是如果我们通过把互联网上的数据抓到一起,就会更生动地刻画出这个人的基础信息、社交信息、基础爱好、生活习惯、消费习惯等等,会为整个大数据体系下的征信和风险评估奠定一个很好的基础。
一些公司在这方面已经做出了一些实践,包括ZestFinance,前两天它的CEO也来中国做了演讲。它主要收集第三方的数据、用户的数据以及互联网的数据。它通过这些数据把一个人大概能有一千到一万以上的描述,通过这些细节的数据,可以很生动、很立体地描绘出一个人。有一句话讲得蛮有意思:没有数据本身也是一种信息。当一个人要收集一万项,这个人只能提供一千项,缺九千项,这个人本身就能提供很好的信息。这在美国算是比较成功的一个利用大数据做风险评估的公司,但是它的数据最大程度上其实依靠的主要是第三方的数据,包括搬家、法律、电话、联系、水电,对社交数据运用得并不多。
SCOR的例子,一般来讲银行如果一个客户做一个评价的时候,银行会使用三大征信的信息,SCOR的信息作为最后补充。SCOR会收集你在facebook、twitter上的数据,作为银行发放信用的一个补充性的信息。、Kabbage这是纯做网络信贷的企业。美国的很多商家其实是多平台上做操作,有的是在Ebay、雅虎等几个电商平台上,单个平台上交易量的信息都不能保证他们获得很好的授信,Kabbage会把不同平台上的数据,物流的数据、社交平台的数据整合在一起,提供一个更加全面的图谱,提供整个风险和评价。
还有像欧洲的银行,应用的会相对保守一些,但是他们也正在用很多大数据的理念完善他们的风控体系。比如这是西班牙第二大银行,通过违约跟不同变量之间的关系做大量的运算,找出来关键的变量。比如说一个小的企业在多个地方的运营,违约率是会比较高的。一个小的企业用信用卡的交易量是比较多的,可靠性也会比较多。通过大量回归性的学习,不断找出违约关键的变量。
中国的拍拍贷这样的公司,也开始这样的探索和尝试。
用大数据解决小微金融的问题,有几个方面是非常关键的,包括数据的使用、数据的计算以及生态系统。其中我们重点强调有三点:第一,中国是比较急需一个对于消费者数据保护的法规。如果双方有契约,使用消费者的数据会有更大范围以及更加可靠的来源,建立互信。第二,很多金融机构包括互联网金融企业在数据的获取管理和解读上非常缺乏人才,尤其缺乏既懂得业务又懂得技术的数据科学家。第三,中国目前整个互联网的发展其实蛮有活力,应该说全球最有活力,但是对于整个数据生态系统的描述不是很全面。像我们在一些国家帮助绘制的描述整个数据生态系统,包括营销用的数据生态系统、风控用的数据生态系统,我们在中国还没有看到完整的图谱,这是比较需要的。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
数据清洗工具全景指南:从入门到进阶的实操路径 在数据驱动决策的链条中,“数据清洗” 是决定后续分析与建模有效性的 “第一道 ...
2025-08-29机器学习中的参数优化:以预测结果为核心的闭环调优路径 在机器学习模型落地中,“参数” 是连接 “数据” 与 “预测结果” 的关 ...
2025-08-29CDA 数据分析与量化策略分析流程:协同落地数据驱动价值 在数据驱动决策的实践中,“流程” 是确保价值落地的核心骨架 ——CDA ...
2025-08-29CDA含金量分析 在数字经济与人工智能深度融合的时代,数据驱动决策已成为企业核心竞争力的关键要素。CDA(Certified Data Analys ...
2025-08-28CDA认证:数据时代的职业通行证 当海通证券的交易大厅里闪烁的屏幕实时跳动着市场数据,当苏州银行的数字金融部连夜部署新的风控 ...
2025-08-28PCU:游戏运营的 “实时晴雨表”—— 从数据监控到运营决策的落地指南 在游戏行业,DAU(日活跃用户)、MAU(月活跃用户)是衡量 ...
2025-08-28Excel 聚类分析:零代码实现数据分群,赋能中小团队业务决策 在数字化转型中,“数据分群” 是企业理解用户、优化运营的核心手段 ...
2025-08-28CDA 数据分析师:数字化时代数据思维的践行者与价值推动者 当数字经济成为全球经济增长的核心引擎,数据已从 “辅助性信息” 跃 ...
2025-08-28ALTER TABLE ADD 多个 INDEX:数据库批量索引优化的高效实践 在数据库运维与性能优化中,索引是提升查询效率的核心手段。当业务 ...
2025-08-27Power BI 去重函数:数据清洗与精准分析的核心工具 在企业数据分析流程中,数据质量直接决定分析结果的可靠性。Power BI 作为主 ...
2025-08-27CDA 数据分析师:数据探索与统计分析的实践与价值 在数字化浪潮席卷各行业的当下,数据已成为企业核心资产,而 CDA(Certif ...
2025-08-27t 检验与 Wilcoxon 检验:数据差异比较的两大统计利器 在数据分析中,“比较差异” 是核心需求之一 —— 如新药疗效是否优于旧药 ...
2025-08-26季节性分解外推法:解锁时间序列预测的规律密码 在商业决策、资源调度、政策制定等领域,准确的预测是规避风险、提升效率的关键 ...
2025-08-26CDA 数据分析师:数据治理驱动下的企业数据价值守护者 在数字经济时代,数据已成为企业核心战略资产,其价值的释放离不开高 ...
2025-08-26基于 SPSS 的 ROC 曲线平滑调整方法与实践指南 摘要 受试者工作特征曲线(ROC 曲线)是评估诊断模型或预测指标效能的核心工具, ...
2025-08-25神经网络隐藏层神经元个数的确定方法与实践 摘要 在神经网络模型设计中,隐藏层神经元个数的确定是影响模型性能、训练效率与泛 ...
2025-08-25CDA 数据分析师与数据思维:驱动企业管理升级的核心力量 在数字化浪潮席卷全球的当下,数据已成为企业继人力、物力、财力之后的 ...
2025-08-25CDA数据分析师与数据指标:基础概念与协同逻辑 一、CDA 数据分析师:数据驱动时代的核心角色 1.1 定义与行业价值 CDA(Certified ...
2025-08-22Power Query 移动加权平均计算 Power Query 移动加权平均设置全解析:从原理到实战 一、移动加权平均法的核心逻辑 移动加权平均 ...
2025-08-22描述性统计:CDA数据分析师的基础核心与实践应用 一、描述性统计的定位:CDA 认证的 “入门基石” 在 CDA(Certified Data Analy ...
2025-08-22