京公网安备 11010802034615号
经营许可证编号:京B2-20210330
金融业是大数据应用的一个重要阵地,其先锋性和潜力不逊于互联网、电信业。
“绝大部分金融公司现在不会再问大数据是什么,有什么好处,而是问怎么做。”Pivotal亚太区产品战略总监李凯翔近日在接受21世纪经济报道记者采访时表示,这是金融行业大数据最近两三年来的改变。
Pivotal是由EMC公司和VMWare公司于去年3月份成立的大数据公司,其整合了两家的数据分析和云应用资产。目前,Pivotal在亚太区已拥有几十家金融机构客户。
李凯翔表示,目前中国的金融机构在大数据方面发展快速,尤其是二线的一些银行,因为他们船小好调头,同时四大行也在有计划的推进大数据。而且,在大数据方面投入的不只是银行,券商、保险、交易所等泛金融类机构都在尝试大数据应用。
李凯翔表示,这些金融机构在大数据建设方面有一个共同点,即首先打破内部信息孤岛,实现数据统一。
两种模式的价值取向
李凯翔表示,金融机构大致分为零售型和商业银行型,前者比如零售银行、信用卡、零售券商等,后者可能是一种大型银行之间的服务,或者是一个大型的交易所。这两种类型在大数据应用方面的出发点有所不同。
传统零售型金融机构一般只记录一些交易、销售等描述性数据,但这部分数据并未得到更加充分的利用。李凯翔以信用卡为例说,从银行角度来看,当用户通过网络或实体店刷卡消费时,这些消费数据会进入银行系统,之前银行只是关注简单的刷卡记录,而没有做外延式的深入分析。而在大数据时代,银行则可以把所有数据综合起来进行分析,比如哪家店使用其信用卡的频次高,从而实现联合营销。
“将这些外部数据和已有的数据连接在一起,然后去做一些分析,这是最明确的方向。”李凯翔表示,零售对大数据的吸收能力是最强的,也是最成熟的,因为它和电子商务做的东西非常类似,只是产品形态不同,一个实物,一个无形产品,两者需要做的都是要深入了解和分析客户特征、需求,针对性的提供商品。
事实上,这一模式在互联网金融领域已逐步成熟,不仅是信用卡、理财产品,甚至小微贷款、消费者信贷等都可以通过大数据画像的方式实现交易和销售。
李凯翔告诉记者,他非常同意BBVA(欧洲一家大型金融机构)CEO的一句话,“银行要么追上亚马逊或者Google,要么就是死亡”。他还预测,如果有一天Facebook可以在任何地方拿到银行业务许可的话,马上会变成全世界最大的银行,因为它有超过10亿的用户。
当然,李凯翔认为,金融机构对行业的理解、趋势的判断和风险的把控更强更深入,一旦充分利用大数据,价值将更大。
商业型金融机构对大数据的利用便是进入一个专业的领域。据李凯翔介绍,这类机构更多的是对内部的数据的整合。他以投资银行为例,传统模式下,交易部门和研究部门的数据是相互独立,甚至数据的储存格式都不同,由此形成一个一个信息孤岛,业务上也是交易部门赚取佣金,研究部门以卖报告为主要收入,相互独立。但当引入统一的大数据平台后,以统一格式将大数据存储,各部门之间就会产生联系。
交易部门通过这个平台,可以了解到哪些客户在研究部门买了什么研究报告,并在多长时间内下单,为什么下单,下多大的单,然后根据分析了解客户的特征,为其“画像”,以便推出新产品时更精确的寻找客户,同时也能够及时了解资本市场的动向。而研究部门则可以通过交易数据,更加准确地对市场做出分析。
从效率到商业模式变革
大数据的发展不仅可以提高金融机构的效率,甚至可以推动商业模式的变革。比如说,大数据在交易所的应用就直接推动了商业模式的延伸。
纽交所曾是Pivotal的一个客户。李凯翔介绍说,以前像高盛这样的机构都会在纽交所租用一定的空间放置主机,以实时了解交易所的交易数据。主机离交易所数据中心越近,数据传输越快。然而,并不是每家投行都可以将主机放在交易所数据中心最近的位置,这导致大家获得数据的速度不同。同时,各家投行每年花费巨资租赁的空间,获得的数据又是一样的,造成极大的资源浪费。
之后,交易所提供了统一的数据平台,各家投行支付一定的费用,可在相同传输速度下获得数据,从而促使纽交所在IPO、交易量、托管之后增加了出售大数据的盈利模式。
李凯翔表示,在亚太地区,中国金融机构在大数据方面的发展较为领先,但同时也面临着一些技术和管理上的障碍。
李凯翔表示,相对其它行业,金融机构在IT方面比较完善,但完善也会带来一个令人头痛的问题,因为一个金融机构的IT供应商有多家,相互独立,并且采用非开源的技术,想要打破信息孤岛,将这些系统连接起来非常困难。还有一个问题是,金融机构的IT人员已经熟悉了原来的系统,因此在项目操作中,都会要求在原有系统上进行改造。
对于复杂的系统,目前采用老业务老系统、新业务新系统的方式,比如移动端就属于新业务。目前很多银行设立了创新部门,搭建一套新的系统,推动移动业务的发展。相比传统模式,移动端的交互频次、交易量、实现形式均有很大不同,因此,在IT系统架构上也会和原有系统不同。当然,新系统和原系统是兼容的,在后台,通过不同触点进入的数据依然汇集到统一的平台上,不影响大数据的分析应用。
相对而言,二线银行的大数据发展速度更快,因为其系统没有那么复杂,改造起来比较容易。
李凯翔表示,金融机构在大数据方面还需要做很多事情,不是一两年可以完成的,之前银行绝大部分都是一个大型主机时代,未来会变成一个移动的世界、云的世界。
本文来自:CDA数据分析师培训官网
CDA学员免费下载查看报告全文:2026全球数智化人才指数报告【CDA数据科学研究院】.pdf
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数字化时代,数据已成为企业决策的核心驱动力,数据分析与数据挖掘作为解锁数据价值的关键手段,广泛应用于互联网、金融、医疗 ...
2026-04-17在数据处理、后端开发、报表生成与自动化脚本中,将 SQL 查询结果转换为字符串是一项高频且实用的操作。无论是拼接多行数据为逗 ...
2026-04-17面对一份上万行的销售明细表,要快速回答“哪个地区卖得最好”“哪款产品增长最快”“不同客户类型的购买力如何”——这些看似复 ...
2026-04-17数据分析师一天的工作,80% 的时间围绕表格结构数据展开。从一张销售明细表到一份完整的分析报告,表格结构数据贯穿始终。但你真 ...
2026-04-16在机器学习无监督学习领域,Kmeans聚类因其原理简洁、计算高效、可扩展性强的优势,成为数据聚类任务中的主流算法,广泛应用于用 ...
2026-04-16在机器学习建模实践中,特征工程是决定模型性能的核心环节之一。面对高维数据集,冗余特征、无关特征不仅会增加模型训练成本、延 ...
2026-04-16在数字化时代,用户是产品的核心资产,用户运营的本质的是通过科学的指标监测、分析与优化,实现“拉新、促活、留存、转化、复购 ...
2026-04-15在企业数字化转型、系统架构设计、数据治理与AI落地过程中,数据模型、本体模型、业务模型是三大核心基础模型,三者相互支撑、各 ...
2026-04-15数据分析师的一天,80%的时间花在表格数据上,但80%的坑也踩在表格数据上。 如果你分不清数值型和文本型的区别,不知道数据从哪 ...
2026-04-15在人工智能与机器学习落地过程中,模型质量直接决定了应用效果的优劣——无论是分类、回归、生成式模型,还是推荐、预测类模型, ...
2026-04-14在Python网络编程、接口测试、爬虫开发等场景中,HTTP请求的发送与响应处理是核心需求。Requests库作为Python生态中最流行的HTTP ...
2026-04-14 很多新人学完Python、SQL,拿到一张Excel表还是不知从何下手。 其实,90%的商业分析问题,都藏在表格的结构里。 ” 引言:为 ...
2026-04-14在回归分析中,因子(即自变量)的筛选是构建高效、可靠回归模型的核心步骤——实际分析场景中,往往存在多个候选因子,其中部分 ...
2026-04-13在机器学习模型开发过程中,过拟合是制约模型泛化能力的核心痛点——模型过度学习训练数据中的噪声与偶然细节,导致在训练集上表 ...
2026-04-13在数据驱动商业升级的今天,商业数据分析已成为企业精细化运营、科学决策的核心手段,而一套规范、高效的商业数据分析总体流程, ...
2026-04-13主讲人简介 张冲,海归统计学硕士,CDA 认证数据分析师,前云南白药集团资深数据分析师,自媒体 Python 讲师,全网课程播放量破 ...
2026-04-13在数据可视化与业务分析中,同比分析是衡量业务发展趋势、识别周期波动的核心手段,其核心逻辑是将当前周期数据与上年同期数据进 ...
2026-04-13在机器学习模型的落地应用中,预测精度并非衡量模型可靠性的唯一标准,不确定性分析同样不可或缺。尤其是在医疗诊断、自动驾驶、 ...
2026-04-10数据本身是沉默的,唯有通过有效的呈现方式,才能让其背后的规律、趋势与价值被看见、被理解、被运用。统计制图(数据可视化)作 ...
2026-04-10在全球化深度发展的今天,跨文化传播已成为连接不同文明、促进多元共生的核心纽带,其研究核心围绕“信息传递、文化解读、意义建 ...
2026-04-09