京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据生态:不再让金融技术“隔靴搔痒”
1月4日,李克强总理在腾讯发起的前海微众银行敲下了电脑回车键,卡车司机徐军就拿到了3.5万元贷款,成为国内首家互联网银行的首笔贷款业务。这一无网点、无柜台也无财产担保要求的微众银行,全凭人脸识别技术和大数据信用评级放贷。
“微众银行一小步,金融改革一大步。”李克强评价道。
三周后,BAT另一巨头阿里巴巴,因淘宝售假受到国家工商总局质疑,马云高调宣布“将设300人专职打假”,用大数据手段向假货宣战,加之其几近成熟的大数据金融体系,一起开启阿里式的大数据新时代。
全球知名数据公司IDC统计,2014年全球大数据金融领域开支上涨30%,超过140亿美元,产值约161亿美元,增速达全球IT产业的7倍。量化其在金融改革、社会便利、人员就业和技术进步等方面的红利,3年内至少高达1000亿美元。
当下,大数据已全面嵌入产业、商业中,释放出巨大的革新动力。随着移动互联网技术的创新性发展,大数据金融也将进一步颠覆传统行业,构建成本更低、效率更高的行业新格局。
普惠金融提速
“从事金融行业多年,始终在关注新技术,但大多都是隔靴搔痒。只有大数据让人眼前一亮。”正德人寿保险公司CIO裴兆旭说,大数据金融就是那只能伸进靴子里的抓手。
国内首家互联网保险公司——众安保险CEO陈劲也公开表示,自己面临的最大考验便是跳出传统金融思维,以技术创新和开拓性眼光规划未来。众安的互联网生态、直达用户以及开发空白领域这三大定位,抓手均是大数据技术。
马云要打假,靠的是大数据,通过智能识别、数据抓取与交叉分析、智能追踪、大数据建模等技术手段,将假货从10亿量级的在线商品中捞取出来。而阿里小贷的运营乃至开设民营银行,更需要大数据的支撑。
阿里人常说,淘宝上每一笔交易的背后都有无数技术细节和信息抓取,有8000多个工程师在组织和修正模型——消费者的消费偏好、上网时长、登陆IP、发退货、信用评价、维权记录和社交媒体数据等16个维度、上千个数据变量被提取和交叉分析。
“住址、手机、证件号等基础搜集相对简单,阿里更看重个人习惯的微妙变化,比如输入密码时习惯停顿,或者某个字母常用左手。”支付宝一位技术部门主管称,互联网银行旨在精准定位,比贷款者更了解贷款者。
同样,在阿里小微金融服务集团副总裁俞胜法看来,大数据就意味着无极限。他认为,所有看似毫无关联的数据皆可用作信用评级。之于个人,是对其细微行为的全画像;之于企业,是对其现金流、贸易流、订单流等的全维度描述。
之于个人,阿里等大数据公司会从微博、社交平台、同学录等获取大事记、信用卡限额、诉讼信息、朋友圈、中小学教育甚至既往病史等等,还可能获取婚姻状况、投资偏好、配偶、担保人、房贷车贷、个人和家庭年收入等信息。
一些大数据公司还会利用个人浏览器中的痕迹,发现浏览足迹和生活习惯,描绘出一幅包括社会关系、网络关系和企业关系的全图谱。
“不同于传统征信关注还款、负债、抵押等资金流动信息,大数据对个人行为的刻画,无孔不入。”俞胜法说,这一切几乎完全自动化,人工部分仅限于事后的模型完善。
例如,阿里的微贷系统就像科幻电影中的中央超核,接入企业B2B数据、消费者数据、淘宝平台数据等,在模型分析后输出决策。这些决策中,会给出贷款人的准入、授信、定价和反欺诈评分,以及不同贷款额度对应的风险系数。其中,还包括对贷款人的成长、流失及其扶植价值等预判。最后,银行等贷款机构将购买数据用以评分,确定细节。
这样的原理也被运用在对企业的考察中。
“我们给多家银行提供服务,统计对象已达1亿规模,既包括资产负债表和水表、电表、报关表等传统信息,也包括企业订单、库存、物流和联保互保等数百个变量。”金电联行(北京)信息技术有限公司董事长范晓忻介绍,数据一有异动就会生成风险提示,比如某笔订单收货期被拖延,系统会立即关注其联保、互保企业。“风控方式从传统金融的事后降低不良率,变为了事前提高风险抑制率”。
例如,阿里小贷的大数据系统就比贷款人更清楚钱的去处及可能导致的坏账率,从而将坏账“扼杀在摇篮中”。
阿里原安全部技术总监蒋韬告诉《财经国家周刊》记者,多年的数据积累和模型修正,使得信用评级模型日趋强大,能持续灌入巨量信息。与传统银行相对落后、割裂的软硬件设施相比,大数据已经无所不能。
截至2014年上半年,淘宝已拥有近900多万店铺,针对其提供信贷的阿里小贷从2010年起,业务规模每年数倍翻番。其微贷事业部累积客户数已达60万人,贷款余额150亿元且全年预计超过250亿元,累计放款超过1900亿元。
同样,微众银行的贷款业务原理趋同,数据偏重社交信息,但最终殊途同归。
近年来,国务院多次针对融资难、融资贵问题发文,将其作为新常态下金融改革的重中之重。一部分无法在传统金融中找到位置的“小微”们,也在大数据上终于尝到了普惠金融的甜头。
征信监管新局
“所有领域中,最早使用大数据的是征信行业。”信而富小贷公司创始人王征宇表示。消费信贷、信用卡等需要大量数据积累,庞大的受众又需要大型运算功能和存储体系,且资金流动风险亦亟须深度把控,使得金融征信业理所当然地成为享用大数据技术红利的首个行业。
例如,针对额度10万元以下的信用卡客户,银行会盯住三个问题:还款能力、还款意愿和收入稳定性,尽管央行征信系统能囊括90%,但坏账率却随着经济下行而不断上升。解决之道,便是用社交、电商等大数据来深入分析剩下的10%,丰满用户“全画像”。
目前,征信数据来源于多个方面:
一是电商,即阿里等的风控数据挖掘系统;二是银行信用卡类,其申请年份、审批、授信额度、还款情况等均为信用参考数据;三是社交网站,以美国LendingClub为例,搭建借贷双方平台,将借款人分为若干信用等级;四是小额贷款类,例如信贷额度、违约记录等,但目前单一企业数据地域性强、数量级低,亟须建立业内共享模式;五是第三方支付,其资金入口和结算通道的角色,使其用户支付方向、月支付额、消费品牌等均可用作评级参考;六则是生活服务类,例如水、电、煤气、物业费等传统金融中的基础信息。
“眼下,P2P非常艰难,实体经济去杠杆,企业违约率快速提升。”金信网首席运营官安丹方表示,P2P须引入真正的互联网基因来革新风控手段,哪怕是高价购买一些大数据后台服务来救急,否则风声鹤唳的P2P行业还将迎来下一轮倒闭潮。
要致富、先修路,这是常识。
1月5日,央行印发《关于做好个人征信业务准备工作的通知》,要求阿里旗下的芝麻信用管理有限公司、腾讯征信有限公司、深圳前海征信中心股份有限公司、鹏元征信有限公司等8家机构做好个人征信业务的准备工作。这一举动,被视为央行架构个人征信“高速公路”的开始。
央行人士称,大数据征信既防范风险,又能提高银行净收益,且随着信贷行业和消费行业的发展提速,将催生出征信业的巨大需求——
《中国征信业发展报告(2003?2013)》显示,目前我国约150家征信机构,总规模仅20亿元左右,与美国和日本分别近800亿元和40亿元的规模相去甚远。以现有规模和征信产品价格计算,我国仅个人征信的市场空间就将达1000亿元,未来将以50倍的力量飙涨。
央行旗下征信机构上海资信有限公司的数据也显示,该公司网络金融征信系统(NFCS)共接入203家P2P平台,日均查询量达2000次。而北京安融惠众征信有限公司的小额信贷行业信用信息共享服务平台,上线一年半内,会员机构达405家,会员间信用信息共享查询量日均约9000次,有信用交易记录的个人更是突破了100万。
“实际上,央行内部对开放个人征信有过争议,焦点在于民间征信数据来源的合法性、合理性,一切都还是摸着石头过河。”央行征信中心一位负责人告诉《财经国家周刊》记者。
监管层真正的顾虑在于,征信市场一旦开放,寻租空间可能难以估量。但大数据时代已大势所趋,在顶层设计上逆势蹒跚不如顺势而为,摸索出一条正道。
当然,不能任由各种民间征信机构扒掉民众的“衣服”,如何对隐私保护拿捏得当,还需司法部门尽快跟上。
全球知名数据库公司Couchbase总裁韦德霍得告诉《财经国家周刊》记者,2015年年初,牛津大学成立了首个金融大数据实验室,旨在将金融市场行为和数据更准确、紧密的融合,解决传统金融业的弊端。美国麻省理工学院也成立了大数据与互联网金融研究中心,开展P2P平台评估、行业风险预警等研究,用大数据建立风控模型、开发新产品——“中国若能持续保持技术前列,则经济增长潜力将被进一步激发。”
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据仓库与数据分析体系中,维度表与事实表是构建结构化数据模型的核心组件,二者如同“骨架”与“血肉”,协同支撑起各类业务 ...
2026-01-16在游戏行业“存量竞争”的当下,玩家留存率直接决定游戏的生命周期与商业价值。一款游戏即便拥有出色的画面与玩法,若无法精准识 ...
2026-01-16为配合CDA考试中心的 2025 版 CDA Level III 认证新大纲落地,CDA 网校正式推出新大纲更新后的第一套官方模拟题。该模拟题严格遵 ...
2026-01-16在数据驱动决策的时代,数据分析已成为企业运营、产品优化、业务增长的核心工具。但实际工作中,很多数据分析项目看似流程完整, ...
2026-01-15在CDA(Certified Data Analyst)数据分析师的日常工作中,“高维数据处理”是高频痛点——比如用户画像包含“浏览次数、停留时 ...
2026-01-15在教育测量与评价领域,百分制考试成绩的分布规律是评估教学效果、优化命题设计的核心依据,而正态分布则是其中最具代表性的分布 ...
2026-01-15在用户从“接触产品”到“完成核心目标”的全链路中,流失是必然存在的——电商用户可能“浏览商品却未下单”,APP新用户可能“ ...
2026-01-14在产品增长的核心指标体系中,次日留存率是当之无愧的“入门级关键指标”——它直接反映用户对产品的首次体验反馈,是判断产品是 ...
2026-01-14在CDA(Certified Data Analyst)数据分析师的业务实操中,“分类预测”是高频核心需求——比如“预测用户是否会购买商品”“判 ...
2026-01-14在数字化时代,用户的每一次操作——无论是电商平台的“浏览-加购-下单”、APP的“登录-点击-留存”,还是金融产品的“注册-实名 ...
2026-01-13在数据驱动决策的时代,“数据质量决定分析价值”已成为行业共识。数据库、日志系统、第三方平台等渠道采集的原始数据,往往存在 ...
2026-01-13在CDA(Certified Data Analyst)数据分析师的核心能力体系中,“通过数据建立模型、实现预测与归因”是进阶关键——比如“预测 ...
2026-01-13在企业数字化转型过程中,业务模型与数据模型是两大核心支撑体系:业务模型承载“业务应该如何运转”的逻辑,数据模型解决“数据 ...
2026-01-12当前手游市场进入存量竞争时代,“拉新难、留存更难”成为行业普遍痛点。对于手游产品而言,用户留存率不仅直接决定产品的生命周 ...
2026-01-12在CDA(Certified Data Analyst)数据分析师的日常工作中,“挖掘变量间的关联关系”是高频核心需求——比如判断“用户停留时长 ...
2026-01-12在存量竞争时代,用户流失率直接影响企业的营收与市场竞争力。无论是电商、互联网服务还是金融行业,提前精准预测潜在流失用户, ...
2026-01-09在量化投资领域,多因子选股是主流的选股策略之一——其核心逻辑是通过挖掘影响股票未来收益的各类因子(如估值、成长、盈利、流 ...
2026-01-09在CDA(Certified Data Analyst)数据分析师的工作场景中,分类型变量的关联分析是高频需求——例如“用户性别与商品偏好是否相 ...
2026-01-09数据库中的历史数据,是企业运营过程中沉淀的核心资产——包含用户行为轨迹、业务交易记录、产品迭代日志、市场活动效果等多维度 ...
2026-01-08在电商行业竞争日趋激烈的当下,数据已成为驱动业务增长的核心引擎。电商公司的数据分析师,不仅是数据的“解读官”,更是业务的 ...
2026-01-08