京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据生态:不再让金融技术“隔靴搔痒”
1月4日,李克强总理在腾讯发起的前海微众银行敲下了电脑回车键,卡车司机徐军就拿到了3.5万元贷款,成为国内首家互联网银行的首笔贷款业务。这一无网点、无柜台也无财产担保要求的微众银行,全凭人脸识别技术和大数据信用评级放贷。
“微众银行一小步,金融改革一大步。”李克强评价道。
三周后,BAT另一巨头阿里巴巴,因淘宝售假受到国家工商总局质疑,马云高调宣布“将设300人专职打假”,用大数据手段向假货宣战,加之其几近成熟的大数据金融体系,一起开启阿里式的大数据新时代。
全球知名数据公司IDC统计,2014年全球大数据金融领域开支上涨30%,超过140亿美元,产值约161亿美元,增速达全球IT产业的7倍。量化其在金融改革、社会便利、人员就业和技术进步等方面的红利,3年内至少高达1000亿美元。
当下,大数据已全面嵌入产业、商业中,释放出巨大的革新动力。随着移动互联网技术的创新性发展,大数据金融也将进一步颠覆传统行业,构建成本更低、效率更高的行业新格局。
普惠金融提速
“从事金融行业多年,始终在关注新技术,但大多都是隔靴搔痒。只有大数据让人眼前一亮。”正德人寿保险公司CIO裴兆旭说,大数据金融就是那只能伸进靴子里的抓手。
国内首家互联网保险公司——众安保险CEO陈劲也公开表示,自己面临的最大考验便是跳出传统金融思维,以技术创新和开拓性眼光规划未来。众安的互联网生态、直达用户以及开发空白领域这三大定位,抓手均是大数据技术。
马云要打假,靠的是大数据,通过智能识别、数据抓取与交叉分析、智能追踪、大数据建模等技术手段,将假货从10亿量级的在线商品中捞取出来。而阿里小贷的运营乃至开设民营银行,更需要大数据的支撑。
阿里人常说,淘宝上每一笔交易的背后都有无数技术细节和信息抓取,有8000多个工程师在组织和修正模型——消费者的消费偏好、上网时长、登陆IP、发退货、信用评价、维权记录和社交媒体数据等16个维度、上千个数据变量被提取和交叉分析。
“住址、手机、证件号等基础搜集相对简单,阿里更看重个人习惯的微妙变化,比如输入密码时习惯停顿,或者某个字母常用左手。”支付宝一位技术部门主管称,互联网银行旨在精准定位,比贷款者更了解贷款者。
同样,在阿里小微金融服务集团副总裁俞胜法看来,大数据就意味着无极限。他认为,所有看似毫无关联的数据皆可用作信用评级。之于个人,是对其细微行为的全画像;之于企业,是对其现金流、贸易流、订单流等的全维度描述。
之于个人,阿里等大数据公司会从微博、社交平台、同学录等获取大事记、信用卡限额、诉讼信息、朋友圈、中小学教育甚至既往病史等等,还可能获取婚姻状况、投资偏好、配偶、担保人、房贷车贷、个人和家庭年收入等信息。
一些大数据公司还会利用个人浏览器中的痕迹,发现浏览足迹和生活习惯,描绘出一幅包括社会关系、网络关系和企业关系的全图谱。
“不同于传统征信关注还款、负债、抵押等资金流动信息,大数据对个人行为的刻画,无孔不入。”俞胜法说,这一切几乎完全自动化,人工部分仅限于事后的模型完善。
例如,阿里的微贷系统就像科幻电影中的中央超核,接入企业B2B数据、消费者数据、淘宝平台数据等,在模型分析后输出决策。这些决策中,会给出贷款人的准入、授信、定价和反欺诈评分,以及不同贷款额度对应的风险系数。其中,还包括对贷款人的成长、流失及其扶植价值等预判。最后,银行等贷款机构将购买数据用以评分,确定细节。
这样的原理也被运用在对企业的考察中。
“我们给多家银行提供服务,统计对象已达1亿规模,既包括资产负债表和水表、电表、报关表等传统信息,也包括企业订单、库存、物流和联保互保等数百个变量。”金电联行(北京)信息技术有限公司董事长范晓忻介绍,数据一有异动就会生成风险提示,比如某笔订单收货期被拖延,系统会立即关注其联保、互保企业。“风控方式从传统金融的事后降低不良率,变为了事前提高风险抑制率”。
例如,阿里小贷的大数据系统就比贷款人更清楚钱的去处及可能导致的坏账率,从而将坏账“扼杀在摇篮中”。
阿里原安全部技术总监蒋韬告诉《财经国家周刊》记者,多年的数据积累和模型修正,使得信用评级模型日趋强大,能持续灌入巨量信息。与传统银行相对落后、割裂的软硬件设施相比,大数据已经无所不能。
截至2014年上半年,淘宝已拥有近900多万店铺,针对其提供信贷的阿里小贷从2010年起,业务规模每年数倍翻番。其微贷事业部累积客户数已达60万人,贷款余额150亿元且全年预计超过250亿元,累计放款超过1900亿元。
同样,微众银行的贷款业务原理趋同,数据偏重社交信息,但最终殊途同归。
近年来,国务院多次针对融资难、融资贵问题发文,将其作为新常态下金融改革的重中之重。一部分无法在传统金融中找到位置的“小微”们,也在大数据上终于尝到了普惠金融的甜头。
征信监管新局
“所有领域中,最早使用大数据的是征信行业。”信而富小贷公司创始人王征宇表示。消费信贷、信用卡等需要大量数据积累,庞大的受众又需要大型运算功能和存储体系,且资金流动风险亦亟须深度把控,使得金融征信业理所当然地成为享用大数据技术红利的首个行业。
例如,针对额度10万元以下的信用卡客户,银行会盯住三个问题:还款能力、还款意愿和收入稳定性,尽管央行征信系统能囊括90%,但坏账率却随着经济下行而不断上升。解决之道,便是用社交、电商等大数据来深入分析剩下的10%,丰满用户“全画像”。
目前,征信数据来源于多个方面:
一是电商,即阿里等的风控数据挖掘系统;二是银行信用卡类,其申请年份、审批、授信额度、还款情况等均为信用参考数据;三是社交网站,以美国LendingClub为例,搭建借贷双方平台,将借款人分为若干信用等级;四是小额贷款类,例如信贷额度、违约记录等,但目前单一企业数据地域性强、数量级低,亟须建立业内共享模式;五是第三方支付,其资金入口和结算通道的角色,使其用户支付方向、月支付额、消费品牌等均可用作评级参考;六则是生活服务类,例如水、电、煤气、物业费等传统金融中的基础信息。
“眼下,P2P非常艰难,实体经济去杠杆,企业违约率快速提升。”金信网首席运营官安丹方表示,P2P须引入真正的互联网基因来革新风控手段,哪怕是高价购买一些大数据后台服务来救急,否则风声鹤唳的P2P行业还将迎来下一轮倒闭潮。
要致富、先修路,这是常识。
1月5日,央行印发《关于做好个人征信业务准备工作的通知》,要求阿里旗下的芝麻信用管理有限公司、腾讯征信有限公司、深圳前海征信中心股份有限公司、鹏元征信有限公司等8家机构做好个人征信业务的准备工作。这一举动,被视为央行架构个人征信“高速公路”的开始。
央行人士称,大数据征信既防范风险,又能提高银行净收益,且随着信贷行业和消费行业的发展提速,将催生出征信业的巨大需求——
《中国征信业发展报告(2003?2013)》显示,目前我国约150家征信机构,总规模仅20亿元左右,与美国和日本分别近800亿元和40亿元的规模相去甚远。以现有规模和征信产品价格计算,我国仅个人征信的市场空间就将达1000亿元,未来将以50倍的力量飙涨。
央行旗下征信机构上海资信有限公司的数据也显示,该公司网络金融征信系统(NFCS)共接入203家P2P平台,日均查询量达2000次。而北京安融惠众征信有限公司的小额信贷行业信用信息共享服务平台,上线一年半内,会员机构达405家,会员间信用信息共享查询量日均约9000次,有信用交易记录的个人更是突破了100万。
“实际上,央行内部对开放个人征信有过争议,焦点在于民间征信数据来源的合法性、合理性,一切都还是摸着石头过河。”央行征信中心一位负责人告诉《财经国家周刊》记者。
监管层真正的顾虑在于,征信市场一旦开放,寻租空间可能难以估量。但大数据时代已大势所趋,在顶层设计上逆势蹒跚不如顺势而为,摸索出一条正道。
当然,不能任由各种民间征信机构扒掉民众的“衣服”,如何对隐私保护拿捏得当,还需司法部门尽快跟上。
全球知名数据库公司Couchbase总裁韦德霍得告诉《财经国家周刊》记者,2015年年初,牛津大学成立了首个金融大数据实验室,旨在将金融市场行为和数据更准确、紧密的融合,解决传统金融业的弊端。美国麻省理工学院也成立了大数据与互联网金融研究中心,开展P2P平台评估、行业风险预警等研究,用大数据建立风控模型、开发新产品——“中国若能持续保持技术前列,则经济增长潜力将被进一步激发。”
CDA学员免费下载查看报告全文:2026全球数智化人才指数报告【CDA数据科学研究院】.pdf
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数字化时代,数据已成为企业决策的核心驱动力,数据分析与数据挖掘作为解锁数据价值的关键手段,广泛应用于互联网、金融、医疗 ...
2026-04-17在数据处理、后端开发、报表生成与自动化脚本中,将 SQL 查询结果转换为字符串是一项高频且实用的操作。无论是拼接多行数据为逗 ...
2026-04-17面对一份上万行的销售明细表,要快速回答“哪个地区卖得最好”“哪款产品增长最快”“不同客户类型的购买力如何”——这些看似复 ...
2026-04-17数据分析师一天的工作,80% 的时间围绕表格结构数据展开。从一张销售明细表到一份完整的分析报告,表格结构数据贯穿始终。但你真 ...
2026-04-16在机器学习无监督学习领域,Kmeans聚类因其原理简洁、计算高效、可扩展性强的优势,成为数据聚类任务中的主流算法,广泛应用于用 ...
2026-04-16在机器学习建模实践中,特征工程是决定模型性能的核心环节之一。面对高维数据集,冗余特征、无关特征不仅会增加模型训练成本、延 ...
2026-04-16在数字化时代,用户是产品的核心资产,用户运营的本质的是通过科学的指标监测、分析与优化,实现“拉新、促活、留存、转化、复购 ...
2026-04-15在企业数字化转型、系统架构设计、数据治理与AI落地过程中,数据模型、本体模型、业务模型是三大核心基础模型,三者相互支撑、各 ...
2026-04-15数据分析师的一天,80%的时间花在表格数据上,但80%的坑也踩在表格数据上。 如果你分不清数值型和文本型的区别,不知道数据从哪 ...
2026-04-15在人工智能与机器学习落地过程中,模型质量直接决定了应用效果的优劣——无论是分类、回归、生成式模型,还是推荐、预测类模型, ...
2026-04-14在Python网络编程、接口测试、爬虫开发等场景中,HTTP请求的发送与响应处理是核心需求。Requests库作为Python生态中最流行的HTTP ...
2026-04-14 很多新人学完Python、SQL,拿到一张Excel表还是不知从何下手。 其实,90%的商业分析问题,都藏在表格的结构里。 ” 引言:为 ...
2026-04-14在回归分析中,因子(即自变量)的筛选是构建高效、可靠回归模型的核心步骤——实际分析场景中,往往存在多个候选因子,其中部分 ...
2026-04-13在机器学习模型开发过程中,过拟合是制约模型泛化能力的核心痛点——模型过度学习训练数据中的噪声与偶然细节,导致在训练集上表 ...
2026-04-13在数据驱动商业升级的今天,商业数据分析已成为企业精细化运营、科学决策的核心手段,而一套规范、高效的商业数据分析总体流程, ...
2026-04-13主讲人简介 张冲,海归统计学硕士,CDA 认证数据分析师,前云南白药集团资深数据分析师,自媒体 Python 讲师,全网课程播放量破 ...
2026-04-13在数据可视化与业务分析中,同比分析是衡量业务发展趋势、识别周期波动的核心手段,其核心逻辑是将当前周期数据与上年同期数据进 ...
2026-04-13在机器学习模型的落地应用中,预测精度并非衡量模型可靠性的唯一标准,不确定性分析同样不可或缺。尤其是在医疗诊断、自动驾驶、 ...
2026-04-10数据本身是沉默的,唯有通过有效的呈现方式,才能让其背后的规律、趋势与价值被看见、被理解、被运用。统计制图(数据可视化)作 ...
2026-04-10在全球化深度发展的今天,跨文化传播已成为连接不同文明、促进多元共生的核心纽带,其研究核心围绕“信息传递、文化解读、意义建 ...
2026-04-09