京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据生态:不再让金融技术“隔靴搔痒”
1月4日,李克强总理在腾讯发起的前海微众银行敲下了电脑回车键,卡车司机徐军就拿到了3.5万元贷款,成为国内首家互联网银行的首笔贷款业务。这一无网点、无柜台也无财产担保要求的微众银行,全凭人脸识别技术和大数据信用评级放贷。
“微众银行一小步,金融改革一大步。”李克强评价道。
三周后,BAT另一巨头阿里巴巴,因淘宝售假受到国家工商总局质疑,马云高调宣布“将设300人专职打假”,用大数据手段向假货宣战,加之其几近成熟的大数据金融体系,一起开启阿里式的大数据新时代。
全球知名数据公司IDC统计,2014年全球大数据金融领域开支上涨30%,超过140亿美元,产值约161亿美元,增速达全球IT产业的7倍。量化其在金融改革、社会便利、人员就业和技术进步等方面的红利,3年内至少高达1000亿美元。
当下,大数据已全面嵌入产业、商业中,释放出巨大的革新动力。随着移动互联网技术的创新性发展,大数据金融也将进一步颠覆传统行业,构建成本更低、效率更高的行业新格局。
普惠金融提速
“从事金融行业多年,始终在关注新技术,但大多都是隔靴搔痒。只有大数据让人眼前一亮。”正德人寿保险公司CIO裴兆旭说,大数据金融就是那只能伸进靴子里的抓手。
国内首家互联网保险公司——众安保险CEO陈劲也公开表示,自己面临的最大考验便是跳出传统金融思维,以技术创新和开拓性眼光规划未来。众安的互联网生态、直达用户以及开发空白领域这三大定位,抓手均是大数据技术。
马云要打假,靠的是大数据,通过智能识别、数据抓取与交叉分析、智能追踪、大数据建模等技术手段,将假货从10亿量级的在线商品中捞取出来。而阿里小贷的运营乃至开设民营银行,更需要大数据的支撑。
阿里人常说,淘宝上每一笔交易的背后都有无数技术细节和信息抓取,有8000多个工程师在组织和修正模型——消费者的消费偏好、上网时长、登陆IP、发退货、信用评价、维权记录和社交媒体数据等16个维度、上千个数据变量被提取和交叉分析。
“住址、手机、证件号等基础搜集相对简单,阿里更看重个人习惯的微妙变化,比如输入密码时习惯停顿,或者某个字母常用左手。”支付宝一位技术部门主管称,互联网银行旨在精准定位,比贷款者更了解贷款者。
同样,在阿里小微金融服务集团副总裁俞胜法看来,大数据就意味着无极限。他认为,所有看似毫无关联的数据皆可用作信用评级。之于个人,是对其细微行为的全画像;之于企业,是对其现金流、贸易流、订单流等的全维度描述。
之于个人,阿里等大数据公司会从微博、社交平台、同学录等获取大事记、信用卡限额、诉讼信息、朋友圈、中小学教育甚至既往病史等等,还可能获取婚姻状况、投资偏好、配偶、担保人、房贷车贷、个人和家庭年收入等信息。
一些大数据公司还会利用个人浏览器中的痕迹,发现浏览足迹和生活习惯,描绘出一幅包括社会关系、网络关系和企业关系的全图谱。
“不同于传统征信关注还款、负债、抵押等资金流动信息,大数据对个人行为的刻画,无孔不入。”俞胜法说,这一切几乎完全自动化,人工部分仅限于事后的模型完善。
例如,阿里的微贷系统就像科幻电影中的中央超核,接入企业B2B数据、消费者数据、淘宝平台数据等,在模型分析后输出决策。这些决策中,会给出贷款人的准入、授信、定价和反欺诈评分,以及不同贷款额度对应的风险系数。其中,还包括对贷款人的成长、流失及其扶植价值等预判。最后,银行等贷款机构将购买数据用以评分,确定细节。
这样的原理也被运用在对企业的考察中。
“我们给多家银行提供服务,统计对象已达1亿规模,既包括资产负债表和水表、电表、报关表等传统信息,也包括企业订单、库存、物流和联保互保等数百个变量。”金电联行(北京)信息技术有限公司董事长范晓忻介绍,数据一有异动就会生成风险提示,比如某笔订单收货期被拖延,系统会立即关注其联保、互保企业。“风控方式从传统金融的事后降低不良率,变为了事前提高风险抑制率”。
例如,阿里小贷的大数据系统就比贷款人更清楚钱的去处及可能导致的坏账率,从而将坏账“扼杀在摇篮中”。
阿里原安全部技术总监蒋韬告诉《财经国家周刊》记者,多年的数据积累和模型修正,使得信用评级模型日趋强大,能持续灌入巨量信息。与传统银行相对落后、割裂的软硬件设施相比,大数据已经无所不能。
截至2014年上半年,淘宝已拥有近900多万店铺,针对其提供信贷的阿里小贷从2010年起,业务规模每年数倍翻番。其微贷事业部累积客户数已达60万人,贷款余额150亿元且全年预计超过250亿元,累计放款超过1900亿元。
同样,微众银行的贷款业务原理趋同,数据偏重社交信息,但最终殊途同归。
近年来,国务院多次针对融资难、融资贵问题发文,将其作为新常态下金融改革的重中之重。一部分无法在传统金融中找到位置的“小微”们,也在大数据上终于尝到了普惠金融的甜头。
征信监管新局
“所有领域中,最早使用大数据的是征信行业。”信而富小贷公司创始人王征宇表示。消费信贷、信用卡等需要大量数据积累,庞大的受众又需要大型运算功能和存储体系,且资金流动风险亦亟须深度把控,使得金融征信业理所当然地成为享用大数据技术红利的首个行业。
例如,针对额度10万元以下的信用卡客户,银行会盯住三个问题:还款能力、还款意愿和收入稳定性,尽管央行征信系统能囊括90%,但坏账率却随着经济下行而不断上升。解决之道,便是用社交、电商等大数据来深入分析剩下的10%,丰满用户“全画像”。
目前,征信数据来源于多个方面:
一是电商,即阿里等的风控数据挖掘系统;二是银行信用卡类,其申请年份、审批、授信额度、还款情况等均为信用参考数据;三是社交网站,以美国LendingClub为例,搭建借贷双方平台,将借款人分为若干信用等级;四是小额贷款类,例如信贷额度、违约记录等,但目前单一企业数据地域性强、数量级低,亟须建立业内共享模式;五是第三方支付,其资金入口和结算通道的角色,使其用户支付方向、月支付额、消费品牌等均可用作评级参考;六则是生活服务类,例如水、电、煤气、物业费等传统金融中的基础信息。
“眼下,P2P非常艰难,实体经济去杠杆,企业违约率快速提升。”金信网首席运营官安丹方表示,P2P须引入真正的互联网基因来革新风控手段,哪怕是高价购买一些大数据后台服务来救急,否则风声鹤唳的P2P行业还将迎来下一轮倒闭潮。
要致富、先修路,这是常识。
1月5日,央行印发《关于做好个人征信业务准备工作的通知》,要求阿里旗下的芝麻信用管理有限公司、腾讯征信有限公司、深圳前海征信中心股份有限公司、鹏元征信有限公司等8家机构做好个人征信业务的准备工作。这一举动,被视为央行架构个人征信“高速公路”的开始。
央行人士称,大数据征信既防范风险,又能提高银行净收益,且随着信贷行业和消费行业的发展提速,将催生出征信业的巨大需求——
《中国征信业发展报告(2003?2013)》显示,目前我国约150家征信机构,总规模仅20亿元左右,与美国和日本分别近800亿元和40亿元的规模相去甚远。以现有规模和征信产品价格计算,我国仅个人征信的市场空间就将达1000亿元,未来将以50倍的力量飙涨。
央行旗下征信机构上海资信有限公司的数据也显示,该公司网络金融征信系统(NFCS)共接入203家P2P平台,日均查询量达2000次。而北京安融惠众征信有限公司的小额信贷行业信用信息共享服务平台,上线一年半内,会员机构达405家,会员间信用信息共享查询量日均约9000次,有信用交易记录的个人更是突破了100万。
“实际上,央行内部对开放个人征信有过争议,焦点在于民间征信数据来源的合法性、合理性,一切都还是摸着石头过河。”央行征信中心一位负责人告诉《财经国家周刊》记者。
监管层真正的顾虑在于,征信市场一旦开放,寻租空间可能难以估量。但大数据时代已大势所趋,在顶层设计上逆势蹒跚不如顺势而为,摸索出一条正道。
当然,不能任由各种民间征信机构扒掉民众的“衣服”,如何对隐私保护拿捏得当,还需司法部门尽快跟上。
全球知名数据库公司Couchbase总裁韦德霍得告诉《财经国家周刊》记者,2015年年初,牛津大学成立了首个金融大数据实验室,旨在将金融市场行为和数据更准确、紧密的融合,解决传统金融业的弊端。美国麻省理工学院也成立了大数据与互联网金融研究中心,开展P2P平台评估、行业风险预警等研究,用大数据建立风控模型、开发新产品——“中国若能持续保持技术前列,则经济增长潜力将被进一步激发。”
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在实验检测、质量控制、科研验证等场景中,“方法验证”是确保检测/分析结果可靠、可复用的核心环节——无论是新开发的检测方法 ...
2026-03-04在数据分析、科研实验、办公统计等场景中,我们常常需要对比两组数据的整体差异——比如两种营销策略的销售额差异、两种实验方案 ...
2026-03-04在数字化转型进入深水区的今天,企业对数据的依赖程度日益加深,而数据治理体系则是企业实现数据规范化、高质量化、价值化的核心 ...
2026-03-04在深度学习,尤其是卷积神经网络(CNN)的实操中,转置卷积(Transposed Convolution)是一个高频应用的操作——它核心用于实现 ...
2026-03-03在日常办公、数据分析、金融理财、科研统计等场景中,我们经常需要计算“平均值”来概括一组数据的整体水平——比如计算月度平均 ...
2026-03-03在数字化转型的浪潮中,数据已成为企业最核心的战略资产,而数据治理则是激活这份资产价值的前提——没有规范、高质量的数据治理 ...
2026-03-03在Excel办公中,数据透视表是汇总、分析繁杂数据的核心工具,我们常常通过它快速得到销售额汇总、人员统计、业绩分析等关键结果 ...
2026-03-02在日常办公和数据分析中,我们常常需要探究两个或多个数据之间的关联关系——比如销售额与广告投入是否正相关、员工出勤率与绩效 ...
2026-03-02在数字化运营中,时间序列数据是CDA(Certified Data Analyst)数据分析师最常接触的数据类型之一——每日的营收、每小时的用户 ...
2026-03-02在日常办公中,数据透视表是Excel、WPS等表格工具中最常用的数据分析利器——它能快速汇总繁杂数据、挖掘数据关联、生成直观报表 ...
2026-02-28有限元法(Finite Element Method, FEM)作为工程数值模拟的核心工具,已广泛应用于机械制造、航空航天、土木工程、生物医学等多 ...
2026-02-28在数字化时代,“以用户为中心”已成为企业运营的核心逻辑,而用户画像则是企业读懂用户、精准服务用户的关键载体。CDA(Certifi ...
2026-02-28在Python面向对象编程(OOP)中,类方法是构建模块化、可复用代码的核心载体,也是实现封装、继承、多态特性的关键工具。无论是 ...
2026-02-27在MySQL数据库优化中,索引是提升查询效率的核心手段—— 面对千万级、亿级数据量,合理创建索引能将查询时间从秒级压缩到毫秒级 ...
2026-02-27在数字化时代,企业积累的海量数据如同散落的珍珠,若缺乏有效的梳理与分类,终将难以发挥实际价值。CDA(Certified Data Analys ...
2026-02-27在问卷调研中,我们常遇到这样的场景:针对同一批调查对象,在不同时间点(如干预前、干预后、随访期)发放相同或相似的问卷,收 ...
2026-02-26在销售管理的实操场景中,“销售机会”是核心抓手—— 从潜在客户接触到最终成交,每一个环节都藏着业绩增长的关键,也暗藏着客 ...
2026-02-26在CDA数据分析师的日常工作中,数据提取、整理、加工是所有分析工作的起点,而“创建表”与“创建视图”,则是数据库操作中最基 ...
2026-02-26在机器学习分析、数据决策的全流程中,“数据质量决定分析价值”早已成为行业共识—— 正如我们此前在运用机器学习进行分析时强 ...
2026-02-25在数字化时代,数据已成为企业决策、行业升级的核心资产,但海量杂乱的原始数据本身不具备价值—— 只有通过科学的分析方法,挖 ...
2026-02-25