
大数据生态:不再让金融技术“隔靴搔痒”
1月4日,李克强总理在腾讯发起的前海微众银行敲下了电脑回车键,卡车司机徐军就拿到了3.5万元贷款,成为国内首家互联网银行的首笔贷款业务。这一无网点、无柜台也无财产担保要求的微众银行,全凭人脸识别技术和大数据信用评级放贷。
“微众银行一小步,金融改革一大步。”李克强评价道。
三周后,BAT另一巨头阿里巴巴,因淘宝售假受到国家工商总局质疑,马云高调宣布“将设300人专职打假”,用大数据手段向假货宣战,加之其几近成熟的大数据金融体系,一起开启阿里式的大数据新时代。
全球知名数据公司IDC统计,2014年全球大数据金融领域开支上涨30%,超过140亿美元,产值约161亿美元,增速达全球IT产业的7倍。量化其在金融改革、社会便利、人员就业和技术进步等方面的红利,3年内至少高达1000亿美元。
当下,大数据已全面嵌入产业、商业中,释放出巨大的革新动力。随着移动互联网技术的创新性发展,大数据金融也将进一步颠覆传统行业,构建成本更低、效率更高的行业新格局。
普惠金融提速
“从事金融行业多年,始终在关注新技术,但大多都是隔靴搔痒。只有大数据让人眼前一亮。”正德人寿保险公司CIO裴兆旭说,大数据金融就是那只能伸进靴子里的抓手。
国内首家互联网保险公司——众安保险CEO陈劲也公开表示,自己面临的最大考验便是跳出传统金融思维,以技术创新和开拓性眼光规划未来。众安的互联网生态、直达用户以及开发空白领域这三大定位,抓手均是大数据技术。
马云要打假,靠的是大数据,通过智能识别、数据抓取与交叉分析、智能追踪、大数据建模等技术手段,将假货从10亿量级的在线商品中捞取出来。而阿里小贷的运营乃至开设民营银行,更需要大数据的支撑。
阿里人常说,淘宝上每一笔交易的背后都有无数技术细节和信息抓取,有8000多个工程师在组织和修正模型——消费者的消费偏好、上网时长、登陆IP、发退货、信用评价、维权记录和社交媒体数据等16个维度、上千个数据变量被提取和交叉分析。
“住址、手机、证件号等基础搜集相对简单,阿里更看重个人习惯的微妙变化,比如输入密码时习惯停顿,或者某个字母常用左手。”支付宝一位技术部门主管称,互联网银行旨在精准定位,比贷款者更了解贷款者。
同样,在阿里小微金融服务集团副总裁俞胜法看来,大数据就意味着无极限。他认为,所有看似毫无关联的数据皆可用作信用评级。之于个人,是对其细微行为的全画像;之于企业,是对其现金流、贸易流、订单流等的全维度描述。
之于个人,阿里等大数据公司会从微博、社交平台、同学录等获取大事记、信用卡限额、诉讼信息、朋友圈、中小学教育甚至既往病史等等,还可能获取婚姻状况、投资偏好、配偶、担保人、房贷车贷、个人和家庭年收入等信息。
一些大数据公司还会利用个人浏览器中的痕迹,发现浏览足迹和生活习惯,描绘出一幅包括社会关系、网络关系和企业关系的全图谱。
“不同于传统征信关注还款、负债、抵押等资金流动信息,大数据对个人行为的刻画,无孔不入。”俞胜法说,这一切几乎完全自动化,人工部分仅限于事后的模型完善。
例如,阿里的微贷系统就像科幻电影中的中央超核,接入企业B2B数据、消费者数据、淘宝平台数据等,在模型分析后输出决策。这些决策中,会给出贷款人的准入、授信、定价和反欺诈评分,以及不同贷款额度对应的风险系数。其中,还包括对贷款人的成长、流失及其扶植价值等预判。最后,银行等贷款机构将购买数据用以评分,确定细节。
这样的原理也被运用在对企业的考察中。
“我们给多家银行提供服务,统计对象已达1亿规模,既包括资产负债表和水表、电表、报关表等传统信息,也包括企业订单、库存、物流和联保互保等数百个变量。”金电联行(北京)信息技术有限公司董事长范晓忻介绍,数据一有异动就会生成风险提示,比如某笔订单收货期被拖延,系统会立即关注其联保、互保企业。“风控方式从传统金融的事后降低不良率,变为了事前提高风险抑制率”。
例如,阿里小贷的大数据系统就比贷款人更清楚钱的去处及可能导致的坏账率,从而将坏账“扼杀在摇篮中”。
阿里原安全部技术总监蒋韬告诉《财经国家周刊》记者,多年的数据积累和模型修正,使得信用评级模型日趋强大,能持续灌入巨量信息。与传统银行相对落后、割裂的软硬件设施相比,大数据已经无所不能。
截至2014年上半年,淘宝已拥有近900多万店铺,针对其提供信贷的阿里小贷从2010年起,业务规模每年数倍翻番。其微贷事业部累积客户数已达60万人,贷款余额150亿元且全年预计超过250亿元,累计放款超过1900亿元。
同样,微众银行的贷款业务原理趋同,数据偏重社交信息,但最终殊途同归。
近年来,国务院多次针对融资难、融资贵问题发文,将其作为新常态下金融改革的重中之重。一部分无法在传统金融中找到位置的“小微”们,也在大数据上终于尝到了普惠金融的甜头。
征信监管新局
“所有领域中,最早使用大数据的是征信行业。”信而富小贷公司创始人王征宇表示。消费信贷、信用卡等需要大量数据积累,庞大的受众又需要大型运算功能和存储体系,且资金流动风险亦亟须深度把控,使得金融征信业理所当然地成为享用大数据技术红利的首个行业。
例如,针对额度10万元以下的信用卡客户,银行会盯住三个问题:还款能力、还款意愿和收入稳定性,尽管央行征信系统能囊括90%,但坏账率却随着经济下行而不断上升。解决之道,便是用社交、电商等大数据来深入分析剩下的10%,丰满用户“全画像”。
目前,征信数据来源于多个方面:
一是电商,即阿里等的风控数据挖掘系统;二是银行信用卡类,其申请年份、审批、授信额度、还款情况等均为信用参考数据;三是社交网站,以美国LendingClub为例,搭建借贷双方平台,将借款人分为若干信用等级;四是小额贷款类,例如信贷额度、违约记录等,但目前单一企业数据地域性强、数量级低,亟须建立业内共享模式;五是第三方支付,其资金入口和结算通道的角色,使其用户支付方向、月支付额、消费品牌等均可用作评级参考;六则是生活服务类,例如水、电、煤气、物业费等传统金融中的基础信息。
“眼下,P2P非常艰难,实体经济去杠杆,企业违约率快速提升。”金信网首席运营官安丹方表示,P2P须引入真正的互联网基因来革新风控手段,哪怕是高价购买一些大数据后台服务来救急,否则风声鹤唳的P2P行业还将迎来下一轮倒闭潮。
要致富、先修路,这是常识。
1月5日,央行印发《关于做好个人征信业务准备工作的通知》,要求阿里旗下的芝麻信用管理有限公司、腾讯征信有限公司、深圳前海征信中心股份有限公司、鹏元征信有限公司等8家机构做好个人征信业务的准备工作。这一举动,被视为央行架构个人征信“高速公路”的开始。
央行人士称,大数据征信既防范风险,又能提高银行净收益,且随着信贷行业和消费行业的发展提速,将催生出征信业的巨大需求——
《中国征信业发展报告(2003?2013)》显示,目前我国约150家征信机构,总规模仅20亿元左右,与美国和日本分别近800亿元和40亿元的规模相去甚远。以现有规模和征信产品价格计算,我国仅个人征信的市场空间就将达1000亿元,未来将以50倍的力量飙涨。
央行旗下征信机构上海资信有限公司的数据也显示,该公司网络金融征信系统(NFCS)共接入203家P2P平台,日均查询量达2000次。而北京安融惠众征信有限公司的小额信贷行业信用信息共享服务平台,上线一年半内,会员机构达405家,会员间信用信息共享查询量日均约9000次,有信用交易记录的个人更是突破了100万。
“实际上,央行内部对开放个人征信有过争议,焦点在于民间征信数据来源的合法性、合理性,一切都还是摸着石头过河。”央行征信中心一位负责人告诉《财经国家周刊》记者。
监管层真正的顾虑在于,征信市场一旦开放,寻租空间可能难以估量。但大数据时代已大势所趋,在顶层设计上逆势蹒跚不如顺势而为,摸索出一条正道。
当然,不能任由各种民间征信机构扒掉民众的“衣服”,如何对隐私保护拿捏得当,还需司法部门尽快跟上。
全球知名数据库公司Couchbase总裁韦德霍得告诉《财经国家周刊》记者,2015年年初,牛津大学成立了首个金融大数据实验室,旨在将金融市场行为和数据更准确、紧密的融合,解决传统金融业的弊端。美国麻省理工学院也成立了大数据与互联网金融研究中心,开展P2P平台评估、行业风险预警等研究,用大数据建立风控模型、开发新产品——“中国若能持续保持技术前列,则经济增长潜力将被进一步激发。”
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
数据清洗工具全景指南:从入门到进阶的实操路径 在数据驱动决策的链条中,“数据清洗” 是决定后续分析与建模有效性的 “第一道 ...
2025-08-29机器学习中的参数优化:以预测结果为核心的闭环调优路径 在机器学习模型落地中,“参数” 是连接 “数据” 与 “预测结果” 的关 ...
2025-08-29CDA 数据分析与量化策略分析流程:协同落地数据驱动价值 在数据驱动决策的实践中,“流程” 是确保价值落地的核心骨架 ——CDA ...
2025-08-29CDA含金量分析 在数字经济与人工智能深度融合的时代,数据驱动决策已成为企业核心竞争力的关键要素。CDA(Certified Data Analys ...
2025-08-28CDA认证:数据时代的职业通行证 当海通证券的交易大厅里闪烁的屏幕实时跳动着市场数据,当苏州银行的数字金融部连夜部署新的风控 ...
2025-08-28PCU:游戏运营的 “实时晴雨表”—— 从数据监控到运营决策的落地指南 在游戏行业,DAU(日活跃用户)、MAU(月活跃用户)是衡量 ...
2025-08-28Excel 聚类分析:零代码实现数据分群,赋能中小团队业务决策 在数字化转型中,“数据分群” 是企业理解用户、优化运营的核心手段 ...
2025-08-28CDA 数据分析师:数字化时代数据思维的践行者与价值推动者 当数字经济成为全球经济增长的核心引擎,数据已从 “辅助性信息” 跃 ...
2025-08-28ALTER TABLE ADD 多个 INDEX:数据库批量索引优化的高效实践 在数据库运维与性能优化中,索引是提升查询效率的核心手段。当业务 ...
2025-08-27Power BI 去重函数:数据清洗与精准分析的核心工具 在企业数据分析流程中,数据质量直接决定分析结果的可靠性。Power BI 作为主 ...
2025-08-27CDA 数据分析师:数据探索与统计分析的实践与价值 在数字化浪潮席卷各行业的当下,数据已成为企业核心资产,而 CDA(Certif ...
2025-08-27t 检验与 Wilcoxon 检验:数据差异比较的两大统计利器 在数据分析中,“比较差异” 是核心需求之一 —— 如新药疗效是否优于旧药 ...
2025-08-26季节性分解外推法:解锁时间序列预测的规律密码 在商业决策、资源调度、政策制定等领域,准确的预测是规避风险、提升效率的关键 ...
2025-08-26CDA 数据分析师:数据治理驱动下的企业数据价值守护者 在数字经济时代,数据已成为企业核心战略资产,其价值的释放离不开高 ...
2025-08-26基于 SPSS 的 ROC 曲线平滑调整方法与实践指南 摘要 受试者工作特征曲线(ROC 曲线)是评估诊断模型或预测指标效能的核心工具, ...
2025-08-25神经网络隐藏层神经元个数的确定方法与实践 摘要 在神经网络模型设计中,隐藏层神经元个数的确定是影响模型性能、训练效率与泛 ...
2025-08-25CDA 数据分析师与数据思维:驱动企业管理升级的核心力量 在数字化浪潮席卷全球的当下,数据已成为企业继人力、物力、财力之后的 ...
2025-08-25CDA数据分析师与数据指标:基础概念与协同逻辑 一、CDA 数据分析师:数据驱动时代的核心角色 1.1 定义与行业价值 CDA(Certified ...
2025-08-22Power Query 移动加权平均计算 Power Query 移动加权平均设置全解析:从原理到实战 一、移动加权平均法的核心逻辑 移动加权平均 ...
2025-08-22描述性统计:CDA数据分析师的基础核心与实践应用 一、描述性统计的定位:CDA 认证的 “入门基石” 在 CDA(Certified Data Analy ...
2025-08-22