
大数据在金融中的应用
由《中国证券投资基金年鉴》主办,广发基金协办的“2015基金营销拓展研讨会”于11月26日在北京召开,本次会议主题为“痛点思维下的转型与创新”。百度技术基础运营部大数据金融商业负责人伍茜在论坛上做了发言。
百度技术基础运营部大数据金融商业负责人伍茜表示,从所谓散户的情绪,从数据当中看到的东西是什么,我们看到这个是我们的产品,它每天都在实时的获取网民的情况,网民的一些情绪,只用一点,就是叫情绪分析,我们利用我们的NLAP技术,百度多年来做搜索,做搜索其实我们对语言的处理应该是世界级的。
以下为嘉宾发言实录:
伍茜:我今天主要是介绍一下百度大数据我们在做什么,我们做的是什么,我们未来想要往金融领域这个方向要怎么样发展,我也是来跟大家学习的,想跟业内的老师多交流,多跟你们探讨,多跟你们学习。
我们分四个部分讲。
首讲一下百度的数据帝国,众所周知我们是非常低调的互联网公司,不像阿里,我们从来不说,花钱也不说,包括前段时间跟中信银行(601998,股吧)成立了一个百姓直销银行也没有说,今天下午我们马上跟安联成立保险公司,其实我们跟其他两家公司不太一样的是我们更想和业内进行合作,因为我们是技术型合作,所以我们更想和业内共赢的生态区发展。
说一下我们的黑科技,我们这个部门在做什么?这是百度在美国硅谷的世界小组,我们筹备了有三年之久,研发有高达40亿美金,有全世界最顶级的专家,我们的核心数据只有一个就叫人工智能。
我们三个部分有北京大数据中心,有17款APP,它涵盖了人们所有的衣食住行以及情绪指标,硅谷研发中心有人工识别、语音识别,我们从数据的角度去还原数据,我们的人工智能就是我们的百度大脑现在可以达到5岁小孩的智商,就是你给它一个图片它就知道这是什么。
关于个人得数据是什么?就是我们涵盖了对你这个人7个纬度,32个行业,10万个标签,这什么意思呢?包括你的兴趣关注点、消费场景、常住地、信用评分,在我们眼中的数据生态是什么?这里面可以说一个我们的想法,在我们看来因为百度是做了一个15年搜索处理信息的公司,我们看来数据是天然就存在的,到今天大家提到大数据这个时代的时候我们会发现数据首先是从量变到质变的,如果换到金融的案例,有一个谷歌的投资,它是做放贷的,也就是说我们数据增信的指标可能只有5个纬度,这个公司它通过大数据改变,我们增值了1000个纬度,这1000个纬度可能来自于当下的行为,以及人际关系等等,增加了变量,这个变量增加的时候我们已经不知道,我们增信已经发生了变化,已经发生了改变,改变的是根本,所以我们看来第一阶段是数据的质变,第二个阶段就是数据的处理。就是刚才主持人念到的非结构数据到结构化,什么叫非结构化呢?就是将新闻的文字化成数据,运用的比较多的,可能运用在我们的广告营销领域,这块是应用最多的,也是应用最广泛的。运用在金融投资里面可能会是什么,我们可以接下来举一些例子。
有看过《失控》的人应该知道,他说流动的才能产生价值。所以说我们觉得通过我们的技术,通过我们的数据,通过我们过往15年来的经历,我们觉得我们应该找到一把钥匙,不管理从个人到价值投资,接下来给大家举一些案例,刚刚说的比较虚幻。
我们有这么技术可以干什么?首先从个人画像出手,上午我听到银行的老师们讲跟客户的互动,什么是客户的互动?我觉得这个其实可以探讨一下。其实我们需要更加了解客户的需求,可能是这样,我们面对这样一些庞大的资金也好,庞大的人群也好,他们到底在想什么?这是我们现在正在做的一个产品,或者说我们数据的一个东西。我们可以根据以往银行中拿到的客户数据,可以看到它的风险感知,它的投资经历,以及过往的财务收入等等,但是我们看不道德另外一点是它的成分特质,它的人生阶段是什么,它的年龄是什么,它的身体状况是什么,以及影响财富的可能性是什么,这个纬度是看不到的。
这是我们拿到的一份数据,可以看到客户的投资情况,他的年龄情况,我们分析出来风险承受能力是中低的,但是加入了我们17款APP的数据我们看到的是什么?他的收入水平是偏高的,地方档次也是中高的以及金融的关注度是高的,以及金融的专业性是中等的,年龄是36-32岁,然后未婚未生育,有房有车,我们得处他的风险承受能力是忠告的,你发现他发挥发生要跟你讨债,或者说他马上要去自杀的行为,所以根据我们这个产品得处理的结论就是他的风险承受能力是什么样的,根据他的身份特质,这时候这个客户当下的情况是什么。有时候是这样,你发现上个月跟这个客户说产品的时候,可能下个月他就改变了他的主意了,原因是什么?原因不是因为他对这个产品的问题,而是他的生活情况发生了改变,也许他突然怀孕了,所以这是我们对个人的画像。
接下来我们说完个人可以说说在投资端我们的大数据可以做什么。从所谓散户的情绪,大家是专家,我们讲的只是我们从数据当中看到的东西是什么,我们看到这个是我们的产品,它每天都在实时的获取网民的情况,网民他的一些情绪,只用一点,就是叫情绪分析,我们利用我们的NLAP技术,百度多年来做搜索,做搜索其实我们对语言的处理应该是世界级的。一个新闻,或者是一篇非机构化的文章出来了以后,我们可以立刻的分析到篇文章的中性或者是正性,或者是负项,这个东西出来了以后它将会往什么样的方向发展,我们通过我们所有的DTD技术发生的最终能力都可以看到,以及对所也数据的结构化我们都可以看到整个市场它到底是什么样情绪。
这个是什么意思呢?我们内部有一个系统叫神经元网络系统。当一个新闻出来,比如克强总理说中国高铁要走出去,走出去以后比如说目前我们现在先选的2800家上市公司,然后我们把它和新闻联结在一起,当这个新闻出来以后股东是什么,业务什么样,上下游什么样,以及连接它的产品又是什么,因为这个新闻的出来那些东西会根据这个行业受到影响,以及公司的影响是什么,我们对内部进行了这样一个系统的剖析。这是我们事件型在金融方向的实验。
以及从行业拐点我们可以怎么看。我们设想一下,因为大家都是老师,所以说大家比较清楚,比如说我们举了地产行业,2014年的时候我们信托违约,这时候最开始爆发点在那儿,我们怎么能够看出来,我们之前调研一个行业它快到拐点的时候我们怎么做的,我们的方法是什么,可能是分析师,除了分析师它每期会出,但这些都不是实时的,数据永远在滞后。到今天我们可以看,换做一个互联网公司我们可以用什么样的眼光或者角度看这个事情呢?我们通过我嫩数据可以看到华润商业楼的空置率可能比龙湖低,从空置率上,再加上全行业的搜索情况,以及全网的分析,我们可以实时的看到一个行业的拐点提前发生,并且这个数据应该能提早将近一个月的时间。
从价格出发,这个是我们每个月跟李克强总理去提出了一份报告,叫中小企业紧急指数,我们可以看到和汇丰比,我们总会提前1-2个月的时间,我们的行业拐点,为什么?因为我们有60万的广告客户,春江水暖鸭先知,只要他交了我们就知道整个中小企业或者景气程度是什么,这是我们在中小业这个板块上我们能做的事情。
还有个有意思的事情也是我们正想推出的,我们觉得这个东西可以跟老师们多探讨,这是对非标资产重新的评估,或者是模式的分析。还是举IOBS为例,我们有对实时景区客流分析的产品,因为我们做的这个产品给到旅游景区的时候,我们突然发现可以预测它未来的情况,以及告诉公路未来收费的情况,因为我们看到除了主的之外时旁边会发生一个什么人群,未来的人流趋势是什么,所以我们会看到这个。在做SPV的时候,我们是不是说加上这样流动的,以及实时的数据在做告诉公路证券化的评估有一些新的方法,有一些新的有意思的地方,这是刚刚我们所说案例。
刚刚主持人提到我们做一些落地的事情,接下来也会陆陆续续在行业内推出,我们确实是上半年跟国信证券(002736,股吧)合作的产品,我们想说一点,也许就像刚刚王老师说的,也有可能效果不好,但是我们不是追求这个,我们追且的并不是收益率有多高,而是我们想要去证实一个事情,也许这个世界正在发生变化,而我们正好参加金融的变化当中,我们希望跟行业内的朋友一起去玩这个事情,因为我们真的觉得从大数据的时代来临开始,我们觉得有更多有意思的事情可以进这个市场升级、变革,从逻辑上,从我们的数据上,从渠道上区升级这个市场,或者是去改变一些事情,这是我们要做的事情,以及这是百度应该做事情。我们有责任,有义务告诉这个市场什么是正确的,什么是错误的。比如说我们太贪婪的要更多高收益的产品,比如说现在的投资人要更多高收益的产品,我们可能告诉他这个人不是这样的,我也很赞赏阿里前段时间做的事情,就是养鸡场,跟鸡民做一些普及,这才是互联网做的事情,因为互联网将所有的东西放大,将所有大家原来讲的看不见的东西放大。如果说今天哪怕我们做一点点改变,这都是我们今天需要改变的。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
2025 年,数据如同数字时代的 DNA,编码着人类社会的未来图景,驱动着商业时代的运转。从全球互联网用户每天产生的2.5亿TB数据, ...
2025-05-27CDA数据分析师证书考试体系(更新于2025年05月22日)
2025-05-26解码数据基因:从数字敏感度到逻辑思维 每当看到超市货架上商品的排列变化,你是否会联想到背后的销售数据波动?三年前在零售行 ...
2025-05-23在本文中,我们将探讨 AI 为何能够加速数据分析、如何在每个步骤中实现数据分析自动化以及使用哪些工具。 数据分析中的AI是什么 ...
2025-05-20当数据遇见人生:我的第一个分析项目 记得三年前接手第一个数据分析项目时,我面对Excel里密密麻麻的销售数据手足无措。那些跳动 ...
2025-05-20在数字化运营的时代,企业每天都在产生海量数据:用户点击行为、商品销售记录、广告投放反馈…… 这些数据就像散落的拼图,而相 ...
2025-05-19在当今数字化营销时代,小红书作为国内领先的社交电商平台,其销售数据蕴含着巨大的商业价值。通过对小红书销售数据的深入分析, ...
2025-05-16Excel作为最常用的数据分析工具,有没有什么工具可以帮助我们快速地使用excel表格,只要轻松几步甚至输入几项指令就能搞定呢? ...
2025-05-15数据,如同无形的燃料,驱动着现代社会的运转。从全球互联网用户每天产生的2.5亿TB数据,到制造业的传感器、金融交易 ...
2025-05-15大数据是什么_数据分析师培训 其实,现在的大数据指的并不仅仅是海量数据,更准确而言是对大数据分析的方法。传统的数 ...
2025-05-14CDA持证人简介: 万木,CDA L1持证人,某电商中厂BI工程师 ,5年数据经验1年BI内训师,高级数据分析师,拥有丰富的行业经验。 ...
2025-05-13CDA持证人简介: 王明月 ,CDA 数据分析师二级持证人,2年数据产品工作经验,管理学博士在读。 学习入口:https://edu.cda.cn/g ...
2025-05-12CDA持证人简介: 杨贞玺 ,CDA一级持证人,郑州大学情报学硕士研究生,某上市公司数据分析师。 学习入口:https://edu.cda.cn/g ...
2025-05-09CDA持证人简介 程靖 CDA会员大咖,畅销书《小白学产品》作者,13年顶级互联网公司产品经理相关经验,曾在百度、美团、阿里等 ...
2025-05-07相信很多做数据分析的小伙伴,都接到过一些高阶的数据分析需求,实现的过程需要用到一些数据获取,数据清洗转换,建模方法等,这 ...
2025-05-06以下的文章内容来源于刘静老师的专栏,如果您想阅读专栏《10大业务分析模型突破业务瓶颈》,点击下方链接 https://edu.cda.cn/g ...
2025-04-30CDA持证人简介: 邱立峰 CDA 数据分析师二级持证人,数字化转型专家,数据治理专家,高级数据分析师,拥有丰富的行业经验。 ...
2025-04-29CDA持证人简介: 程靖 CDA会员大咖,畅销书《小白学产品》作者,13年顶级互联网公司产品经理相关经验,曾在百度,美团,阿里等 ...
2025-04-28CDA持证人简介: 居瑜 ,CDA一级持证人国企财务经理,13年财务管理运营经验,在数据分析就业和实践经验方面有着丰富的积累和经 ...
2025-04-27数据分析在当今信息时代发挥着重要作用。单因素方差分析(One-Way ANOVA)是一种关键的统计方法,用于比较三个或更多独立样本组 ...
2025-04-25