
云计算和大数据助力金融互联网创新_数据分析师
2015年3月26日, 由中国网上银行促进联盟主办的“第六届网银联盟大会暨直销银行发展论坛”在北京贵都大酒店召开。来自金融行业监管机构、国有商业银行、股份制商业银行及城市商业银行的高层领导,金融行业研究者、观察员及从业人士、网上银行解决方案专家、金融IT精英等一百余名嘉宾莅临大会,共同探讨金融互联网变革大计。阿里金融云总经理徐敏在大会中发表演讲。
以下为演讲实录:
今天我会分成三个内容,第一讲讲在我眼中互联网是什么样子,第二个整个阿里巴巴大数据怎么做,第三让我们的能力进行合作,共创,在金融行业走的更快。
其实在来到阿里巴巴之前,我也花很多时间帮助银行,做了很多,但做完以后,当时我有很大困惑,很多规划看上去很美,但落地效果不好。所以我带着困惑来阿里巴巴的,在这边看它是怎么做的,它有哪些经验跟我们共享,阿里巴巴的成功最重要是两点,第一是屌丝经济,第二平台经济,屌丝经济服务于大型企业,慢慢慢慢不断下沉,服务小微企业,服务个人,这块阿里巴巴做的非常好。可能马云是目前我认为在国内第一个提出来做屌丝经济的人,而且是做成功的,他做了大量大量的小额生意,让大量不能够参加广交会的厂商能够把货用到国外去,像淘宝说我没有钱开实体店,没问题,上我这来开店吧,我要让农民也能用淘宝,所以马云能够把这些大量的小而美的生意做成功了,而且做成这么大上市公司,他背后有很多他逻辑在里面,甚至包括大数据的云计算,也是底下最重要的平台。另外角度是什么,是平台经济,这个词最近炒得很火,我进到阿里巴巴内部,经常提到最多的词是社会责任感,如果客户有一百万,没关系,我先帮助你做一千万,然后再拿我应得的那部分,我的收入,我经常参加内部一些高层的会议,看到一部特别漂亮的报表的时候,他们就说,我们这回数字这么好,太好了,那一定是说我们对未来投资说了,所以这个就是说,今天我们做互联网金融,我们要考虑,我要的是今天的利润还是明天的平台,这个需要在座各位去考虑。这个模型在我来看是一个比较能代表互联网金融,特别在传统金融跟互联网结合的。左侧是消费者,这个是互联网世界最强的地方,右侧是产业资源,这个是我们传统金融行业特别强的地方,今天我们要做的事情,如何通过APP,通过应用模式,通过业务模式,通过数据,把这两者打通
跟大家讲个小的例子,在阿里内部有个娱乐宝,让很多屌丝一起投资拍电影,我可以由10个亿的投资额,请很多人来投资,我要求每一个人投资两千块钱,所以会聚很多很多用户,当我带着这些用户跟制片方谈的时候,会非常好谈,这些粉丝一定会去看电影,同时把这个电影推给很多人,把电影炒起来,所以包括陆川也说我一定要跟阿里巴巴合作,如何在线上优势跟线下优势整合一起。
这个是互联网金融我个人认为最重要的三个能力,第一个入口,你怎么抢到入口,第二是有效流量,第三是客户运营,归纳起来整个互联网金融,最重要两个模式是什么?是屌丝经济加平台经济,最重要能力是什么?是入口,有效流量和客户运营,我认为在今天,最银行业做互联网创新,这也是非常重要的模式。
这个模式很漂亮,它背后需要很多很多来支撑的,这个是阿里巴巴整个架构图,最重要是三个模块,是电商、物流,它分别代表了钱流、资金流、物流三个方面,我把客户产生在各个角落的数据都打通,通过某种形式制造业务。所以我们内部在谈一个词叫DT时代,从IT时代到DT时代有这么几个重要的转变,今天主体是数据,第二个变化在IT时代,一定是数据跟着应用走,会把整个企业到一起来做,今天一定应用跟着数据走,原因很简单,因为数据太大了,你搬不动。今天我们做了很多互联网金融应用,一定要把应有放到数据周边去做,不是要求数据过来,这个方向是错的。第三个,在以前我的数据是说,让人应用更好,而今天很多时候,我的数据就是业务本身,就像我们阿里小贷,所有的业务完全基于数据,不需要任何人工介入。所以这是最重要的三个变化,从IT时代到DT时代的变化。
下面讲讲我们阿里巴巴的大数据战略,马总说的比较多一切业务数据化,一切数据业务化,第二个超过数百PB的数据量,数据是生产资料,第三个是打通202家子公司,第四个是集团有专门的数据管理委员会等等,这是我们一些数据节选,很多很多数据。这块整个阿里巴巴的历程,第一部分是数据积累,我们积累的是数据,第二是业务上云,把所有业务都发展云上来,因为在云上才能把数据落下来,大家记住数据不是采集的,是沉淀的,是落下来的,这里很关键。第三点数据上云,以前数据分散在很多地方,由于家ODPS平台。第四个数据平台化,通过商业模式把它变成平台,第五是数据资产化,希望打造一个数据生态圈,让整个社会变得更加透明,更加高效。
下面讲几个重点产品,第一个在贷款的业务,这一块比较典型就是我们的阿里小贷,它整个业务都能够通过授权现实现,几乎不需要任何人工介入,我们能够做到一块钱起贷,在使用什么时候你需要钱,放贷策略是什么样子,都能够在30毫秒时间搞定,举个例子,你是淘宝卖家,只要跟我交互,我向你咨询问题,你是在一分钟之内回答我,还是五分钟之内回答我,或者我跟你交互三次,交互十次都是不一样的,所以整个过程我们用了很多变量保证整个模型非常准确,这个我们做到整个不良1%左右。第二个产品是应用类,目前比较重要产品就是信用,举个例子,今天你可能是在网上订房间,你订十次,去了八次和订十次去两次是不一样的,今天我们做租车的时候,如果风速高的可以做押金,所以这是一个很好的应有,今天信用跟我们很多在座的银行对接,今天你去看客户的信用,是一个很重要的收入,信用是另外两个,你知道客户到底行不行。
包括支付宝里面风控这块有很多实际经验,这块我们目前也在跟银行谈,我们这个经验怎么和你这边互联网对接起来。包括这个是我们在客服这一块,如果你用淘宝的话,你用旺旺跟我们交流的时候,大概有75%的概率你是跟机器人在说话,而不是跟人在说话,有50%概率全部机器搞定,这个目前也在把它变成一种主流,每个行业都不一样。跟大家讲个例子,这个例子是众安保险,也是我们自己的保险公司,它是目前第一家从互联网保险公司,所有的系统都在云上,在阿里金融上,通过了保监会的整合,在今年双11这一天里面,它就卖出1.82亿笔定单,主要是退运费险,每一笔保单只有5毛钱,所以这里面有两个关键因素,通过云把成本降得很低,众安保险是国内第一家开业6个月之内就能够实现盈利的保险公司,第二个我通过非常精确的,精准的定价,来实现5毛钱平均价格里面还能挣钱,据个例子,我在淘宝的时候,看到商品一分钟下内,你的退运险可能会很贵,或者看两个小时下单,认为贵的举手?认为便宜的举手,很多细节在里面,给到你这个价格多少,最有可能盈利,所以这是一个大数据、云计算以及互联网结合的经典案例,变成一个企业的效率。
后面有几张片子是关于IT的,简单说一下,这个是我们整个大数据架构的盈利图,最上面是对外,ODPS框架,包括图计算引擎,包括流处理引擎,我们整个做阿里云几十万服务器监控,包括运维,几乎都是通过数据来实现的,这些数据我们都是不落地的,目前阿里云的,负责整个云平台的商户,应该能排进全中国规模十大,量非常大。包括我们自己这几年的变化,所以从2012年开始用了HADOOP,第一对我们来说规模还是不够,因为我们ODPS平台对所有的提供云服务,必须有非常强的安全管控,所以第三点还有其他数据共享的方式,后来我们自己研发一个平台叫ODPS,那个平台目前500多PB,包括中国气象局的数据也在我们上面,而且这个ODPS还有什么好处,它是一个大池子,里面有不同的小池子,放不同的数据,假如你要跟气象局进行交互,没关系,只要跟气象局达成就好,它是底下同构的大平台。所以大家记住,我刚刚说过,在DT时代,一定运用跟着数据走,如果ODPS成为未来数据积累的话,你们很多业务都可以基于它做创新。
这是我们整个双11的成绩单,交易额是571亿元,正好跟杭州的区号0571一样,现在我们大概今年的交易容量是一秒钟8万笔,这个大致在目前比较大一点银行的交易笔数,一年是一万笔左右,如果今年是8万笔,明年可能做更大,我们能够在6个小时之内处理100个PB的量,我们在它1000倍或者500倍数据量。这上面有字比较小一点,叫Oceanbase,是我们自己研发的,内部正在用它来做一些交易要求,今年双11的时候,10%的流量是通过它处理的,所以Oceanbase是未来我们内部做一些系统的数据库,包括有一些异地数据中心多活,比如杭州的机房太热了,可以把那部分荷载切到青岛去。
总体来说,云或者大数据的能力,相比较于传统金融技术,有不同的能力所在,开放性可能云的价格会更加开放,特别是说更互联网世界对接,第二并发会不同的方式来体现,成本这一块是一个很重要的考量,今天支付宝之所以能这么大,因为我们交付很低,我们只要需要两三分钱就好了,所以做很多创新,小的80块钱左右,现在阿里网商银行,所有系统,所有技术都是我们自己,不用任何商业软件,包括数据库,包括模型,核心模型是我们自己设计的,未来希望做到整个单账户在一块钱以下,甚至更低,这也是我们一些优势。包括我们的快速迭代变更这一块,不升级是不需要迭代的。
最后讲讲阿里巴巴能力输出,给大家讲这么一个例子,我们刚跟一个保险公司合作车险,今天我通过支付宝钱包进去,可以查到我在某一个保险公司车险的价格,我可以去挑好客户,如果好客户价格会很低,如果坏客户,价格会很高,这个怎么做呢?我们有三部分数据,第一是你这家保险公司历史保单数据,第二个是什么?是说你这个客户在我整个阿里巴巴体系里面,你是不是毛躁过,第三个是阿里巴巴的数据地图,是不是容易发生车祸事故,你是不是属于3级的客户,急刹车,急转弯的客户,基于这三个因素在一起,能看出你是不是一个好客户,而且这个上线以后,第一个月的查询转换多少?46%,特别高,100个客户查酒驾,这里面一个小窍门是什么,客户是从支付宝钱包进来,我有3个亿的客户会访问支付宝钱包,所以这个业务创新是非常好,所以未来我们也希望跟大家有创新,比如你要推直销银行,或者给用户发信用卡,他没有收入证明,没关系,你上我这边查一下,或者客户授权银行来我这边查一下,或者信用卡等等一系列,或者你要推你的直销银行,你去发展你的客户,我们有更多的合作。芝麻信用探讨很多的模式,希望有兴趣的同事跟我们对接。这些是内部办公工具,包括邮箱,钉钉是我们内部的软件特别好,包括还有自己的零车险,首套系统,这是安卓和IOS之外在中国最主要的手机,它的最主要问题是什么?安全,现在很多部委都它定为国家采购,未来如果我们要去武装我们的前端会员,应该装一部分个人的系统,建议用这套系统,非常安全,最近我们正在跟一家保险公司谈,60个钱单保险经济人都装这个。
阿里金融云,它是来自于阿里云,一是云计算,第二大数据,云计算这块,阿里云是目前全世界第四个能够把5000台服务器变成一台服务器对外输出的公司,在我们之前只有雅虎、谷歌和亚马逊能够做到,FACEBOOK都做不到,这是第一个。第二点,阿里金融云做什么它是在阿里云基础上做了很多增强,特别是安全和管控,其实阿里云本身管控能力已经很强了,任何一个地方损坏是没问题的,当时我们前台服务器一上线以后,做了一个5000浮的服务器,把电闸拉了,再推上去,没一条数据丢失,而今天在杭州有两个机房,所以这个是没有满足我们的要求。这层飞天就是刚刚说的5000台服务器变成一台服务器的,包括OSS,包括OTS是一个数据库,RDS目前支持两个版本,上面我跟很多合作伙伴对接,他会把很多应用做很多接口,举个例子,快捷支付,很多合作伙伴会放上面,对接,你跟我对接是很容易实现的。还有安全这块,能够跟银行进行对接,做专线,各种都是可以的,这是整个阿里金融的架构图。因为阿里金融的存在,我们还做了很多增强,最下面是BPAS,我们把支付宝那么多年的经验,放在云上,这样开发就更容易了,目前正在投产,下个月部分客户就会使用到。再往上叫DAAS平台,SAAS平台,我们目标是什么,目标是今天阿里金融云对外是个云平台,明天我们将是一个金融基础设施的平台,在上面不光是云,还有数据,还有业务,有很多合作,金融云它是个容器,是说在云上你可以很方便,跟你的用户,以及客户与客户之间进行互动,进行数据、金融和业务三个层面的交互。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据库日常操作中,INSERT INTO SELECT是实现 “批量数据迁移” 的核心 SQL 语句 —— 它能直接将一个表(或查询结果集)的数 ...
2025-10-16在机器学习建模中,“参数” 是决定模型效果的关键变量 —— 无论是线性回归的系数、随机森林的树深度,还是神经网络的权重,这 ...
2025-10-16在数字化浪潮中,“数据” 已从 “辅助决策的工具” 升级为 “驱动业务的核心资产”—— 电商平台靠用户行为数据优化推荐算法, ...
2025-10-16在大模型从实验室走向生产环境的过程中,“稳定性” 是决定其能否实用的关键 —— 一个在单轮测试中表现优异的模型,若在高并发 ...
2025-10-15在机器学习入门领域,“鸢尾花数据集(Iris Dataset)” 是理解 “特征值” 与 “目标值” 的最佳案例 —— 它结构清晰、维度适 ...
2025-10-15在数据驱动的业务场景中,零散的指标(如 “GMV”“复购率”)就像 “散落的零件”,无法支撑系统性决策;而科学的指标体系,则 ...
2025-10-15在神经网络模型设计中,“隐藏层层数” 是决定模型能力与效率的核心参数之一 —— 层数过少,模型可能 “欠拟合”(无法捕捉数据 ...
2025-10-14在数字化浪潮中,数据分析师已成为企业 “从数据中挖掘价值” 的核心角色 —— 他们既要能从海量数据中提取有效信息,又要能将分 ...
2025-10-14在企业数据驱动的实践中,“指标混乱” 是最常见的痛点:运营部门说 “复购率 15%”,产品部门说 “复购率 8%”,实则是两者对 ...
2025-10-14在手游行业,“次日留存率” 是衡量一款游戏生死的 “第一道关卡”—— 它不仅反映了玩家对游戏的初始接受度,更直接决定了后续 ...
2025-10-13分库分表,为何而生? 在信息技术发展的早期阶段,数据量相对较小,业务逻辑也较为简单,单库单表的数据库架构就能够满足大多数 ...
2025-10-13在企业数字化转型过程中,“数据孤岛” 是普遍面临的痛点:用户数据散落在 APP 日志、注册系统、客服记录中,订单数据分散在交易 ...
2025-10-13在数字化时代,用户的每一次行为 —— 从电商平台的 “浏览→加购→购买”,到视频 APP 的 “打开→搜索→观看→收藏”,再到银 ...
2025-10-11在机器学习建模流程中,“特征重要性分析” 是连接 “数据” 与 “业务” 的关键桥梁 —— 它不仅能帮我们筛选冗余特征、提升模 ...
2025-10-11在企业的数据体系中,未经分类的数据如同 “杂乱无章的仓库”—— 用户行为日志、订单记录、商品信息混杂存储,CDA(Certified D ...
2025-10-11在 SQL Server 数据库操作中,“数据类型转换” 是高频需求 —— 无论是将字符串格式的日期转为datetime用于筛选,还是将数值转 ...
2025-10-10在科研攻关、工业优化、产品开发中,正交试验(Orthogonal Experiment)因 “用少量试验覆盖多因素多水平组合” 的高效性,成为 ...
2025-10-10在企业数据量从 “GB 级” 迈向 “PB 级” 的过程中,“数据混乱” 的痛点逐渐从 “隐性问题” 变为 “显性瓶颈”:各部门数据口 ...
2025-10-10在深度学习中,“模型如何从错误中学习” 是最关键的问题 —— 而损失函数与反向传播正是回答这一问题的核心技术:损失函数负责 ...
2025-10-09本文将从 “检验本质” 切入,拆解两种方法的核心适用条件、场景边界与实战选择逻辑,结合医学、工业、教育领域的案例,让你明确 ...
2025-10-09