登录
首页精彩阅读鲍忠铁:深度商业分析的7大基石
鲍忠铁:深度商业分析的7大基石
2016-09-12
收藏
本文为TalkingData首席金融行业专家CDAS2016大数据金融分论坛上的分享,已经过嘉宾审核,整理出来,以飨读者。
----------------------------------------

今天跟大家分享三方面的内容,一个是深度商业分析的七大基石,另外是怎么做客户洞察和数据的应用,因为我们很多大数据应用在金融行业的初始点就是进行客户画像和客户洞察的,最后讲机器学习在金融行业应用实践。


我先讲一个案例,大数据从2012年开始火爆,谈到大数据应用,就会讲到Target 百货分析16岁的少女买无香型沐浴露之后,判断她怀孕了的这个故事。那么这个故事的原因是什么?通过哪些线索和数据分析来判断这个少女怀孕了呢?详细我就不详细介绍了,大家可以看,科学家对怀孕这件事件做了一个预测,设25个指标,根据用户的购买行为进行打分,如果你超过了某一个分值的话,可能你就属于高概率怀孕的人群了。


另外,在大数据应用的过程中,很多都是大概率事件,大数据不是百分之百确定的事件,往往谈的是一种概率。就像这个女孩子似的,她有很高的概率是怀孕了,当然也有预测失误的时候,有很大的概率她是不怀孕。我们学概率的时候学过一句话“小概率事件不等于不发生”,这种概率基本上趋近于零,但是它已经发生了。

我们看一下深度商业分析,分析团队和执行团队对待数据是不一样的,执行团队拿到数据知道该怎么做,正在做什么和未来做什么,分析团队拿到数据之后他要知道发生了什么,什么正在发生,什么原因在发生?最重要的不是对历史的回溯,也不是对历史数据的结论,其实是对未来的一个预测。所以说深度分析的目的就是为了预测未来即将发生的一些商业经营活动。



深度商业分析还没有一个行业的定义,我们按照我们的一些理解去定义:利用数据和工具找到一些隐藏在数据背后的商业规律,对即将发生的商业行为进行预测,为企业的经营者提供决策支持,这是我们认为是深度商业分析。数据的成熟度有五个阶段,一个是数据的采集、一个数据的描述、一个数据的挖掘、一个数据的预测、一个数据的决策,整个数据科学最成熟的阶段就是数据的决策,就是AI要做的事情。

一、深度商业分析的七大基石

深度分析有几个基石:

商业挑战



在过去一段时间产品没有很丰富的时候,我们面对的商业挑战和现在商品过度丰富的情况不一样,比如说新客户的获取、存量客户的保存、怎么样面对市场份额,怎么样提高单客价值,怎么样提高客户的体验和客户对产品服务的需求。商业挑战是数据分析的一个入手点,你的数据分析就是从你的商业挑战、KPI来进行的,这些商业挑战就是商业分析,或者叫深度商业分析的一个切入口。

第二块就是数据基石。



过去的科学家统计过,在没有大数据的时代之前,人类社会中至少有70%的决策没有数据支撑,也就是只有30%的决策是在数据的基础上进行的。如果进行了深度的商业分析,数据就是一个基石,可以是自己的数据,也可以是外部的数据,也可以是一些分析后的数据,也可以是行业的数据。无论是哪一种数据,最后归结到数据应用的成熟度,也就是所谓的决策。

我们提到整个数据应用的决策,是五个阶段最重要的。大数据有两个特点,一个特点就是可以很快地处理海量的实时数据,第二是可以利用实时的处理能力找到一些数据背后的规律,用这些规律做一些模型。数据是整个商业分析的基础,现在有些企业在做数据分析的时候说我没有数据,比如制造业或者其他传统企业,没有像电商、金融这样的丰富数据,但是它有一些社交数据、外部数据和销量数据,这些数据都可以作为数据分析的基石。

第三块就是分析实施的基石。


在进行分析的过程中,你要考虑处理好哪些数据,比如说你的商业目标是什么?你怎么样能达到你的商业目标,需要哪些部门支持?需要哪些数据?哪些软件?大家做数据分析的时候,除了要了解商业挑战,除了要有数据,还要有一些其他资源。一个成功的企业有两个成功的要点,一个是业务场景一个是技术场景,如果商业模式特别好,有好的业务场景,但是没有技术手段去实现这个业务场景,商业模式也不能成功。一个企业既有技术的领先性又有商业模式的领先性才能成功。

第四块是洞察基石。



分析人员在做深入商业分析的时候,可以用IMPACT的方法论,首先我们要掌控数据,赋予一些数据的标签,最后是做传播、观察,最后再回到确定问题,大数据时代深度商业分析最核心的就要做一个数据闭环,因为有数据支撑的闭环对你整个决策的反馈有很大的支撑作用。

在这里要强调一点,在洞察一个商业机会的时候,我们基于数据的决策,无论在企业里面碰到多大的阻力,还是要提出自己的建议。往往你的建议在很小的环境下,或者在一些很幸运的环境里是可以得到验证的。我们在一些企业里看到,往往基于数据的决策,基于数据的分析最后被论证是正确的。

第五块是执行和预算基石。


执行和预算是否完成了目标、展示了成果,怎么增加收益,提升生产力,基本是从这三个纬度。数据的运用在整个中国,或者在世界上基本上集中在两块,一个是我们说的精准营销,或者风控。精准营销就是类似于有推荐引擎,风控就是今天我们讲这些大数据风控。数据对企业的作用也是基于三个方面,一个是增加企业的收入,第二是提高它的效率,降低它的成本,第三就是提高客户满意度,如果你的分析从这三方面可以帮助企业的话,你的分析对于企业业务类的场景就可以得到支持。

下一个是知识共享基石。



在做商业分析的时候,企业不是靠一个人,是靠一个团队,这个团队有可能是属于信息中心,也有可能是属于业务部门,无论是哪个部门,我们历史上分析的结论、工具、智慧,其实都是要共享的。这样的话才能为后面的人、后面的商业分析提供一些基础。有了这样的共享的话,对企业来说,以后进一步做商业分析、做数据分析之后会减少很多的弯路。

第七个就是创新的基石

商业分析首先是揭示一些逻辑,然后是预测商业行为,最后是优化商业活动。成功的企业在数据分析和商业分析有几个特征,第一个要聚焦客户,过去都是以产品为中心,未来一定是以客户为中心。另一个要做到产品的差异化,第三要做理解和预测市场以及趋势,第四要执行的迅速,还要鼓励员工推行分析和创新。

以上讲的七个方面都是做深度商业分析的基石,如果按照这个方法论和这个基础去做的话,相信这个企业在数据文化、数据思维和数据的商业应用上会有提升。

二、客户洞察和数据应用

接下来就分享一下,在金融企业里面我们做的一些客户洞察或者是数据应用——我们怎么给企业做客户画像。

客户画像这个词在数据应用的中提得比较频繁。做客户画像的时候我分享一些方法,首先要以信用信息和人口信息为主,在金融企业里信用信息代表你消费能力,不同消费能力的人群需要推荐不同的金融产品,屌丝有屌丝的,中产阶级有中产阶级的,高富帅有高富帅的。

另外就是人口属性,就是我们的年龄、职业、邮箱、电话号码,就是人们在这个社会上标识的一些属性,有了这些属性之后金融企业可以进行一些营销。我们认为人口属性是联系到这个人的,刻划这个人的信息,有了人口属性你可以定义营销手段是邮件还是短信、还是面对面地触达。


第二要采用强相关的信息,我们做用户画像的时候,或者做一个商业场景的时候,会考虑到信息跟场景之间的相关关系,比如说看这个人的投资偏好,看这个人投资的风险偏好,他的历史交易行为和收入可以支撑个人的一些投资偏好和风险特征,至于血型、星座跟这个没多大关系,进行用户画像时基本上有一些强相关的信息,不会有弱相关的信息。

最后一个就是定量,金融企业也好,或者是其他企业也好,会有大量的非定量的信息,而我们在进行机器学习和预算的时候,机器只能识别一些量化的信息,如果没有量化的信息,只是一个描述的信息,比如说白羊座、A型、B型,这对机器信息是无效的。我们会把非量化的转化成量化信息,比如说年龄21岁—35岁,你可以定为青年。在对不同年龄段的人推荐产品、做风控的时候不一样,年龄越大的人风险越高,因为他赚钱的可能性会越来越低。所有的这些信息都是为了评他的信用,找到有效的场景。


具体来说,我们画像的时候会从五类信息对客户进行画像,比如说他的人口属性,知道这个用户是谁,我们怎么样联系这个用户;另外一个是知道信用信息,知道资产收入、支付,用于风险控制,然后看他的消费习惯和喜好偏好,还有个人兴趣,以及社交媒体,大部分不会短时期内改变,社交信息由于不同的场景,比如说上半年是旅游,下半年可能去买房,可能再过几年结婚,这种社交属性的信息的话,是需要实时更新的。在用户画像的时候,基本上我们采用这五类信息,大家做用户分析的时候,也会采用这五类信息,只不过前四类是静态的信息,第五类是动态的信息。

社交信息到底有什么用呢?大家如果在汽车之家,或者在途牛、穷游上发一条信息,这些信息基本上已经被企业拿到了,比如说你认为奥迪A6比较好的时候,其实这个网站已经把你的信息抓给平安了,平安可能会对你提供推销车险,或者推销相应的购车的优惠活动。当你在途牛或者穷游上发了一条消息,比如说罗马哪个地方好完,信用卡就会获取这条信息,给你推一些出游信息。在精准营销这一块,很多网站信息联动都已经达到了,比如说你在京东上看了一个笔记本,网易也都给你推荐出来,因为数据都是打通的。

金融企业做用户画像,我们建议做五步,一个是要把画像相关的数据集中在一起,第二步找到跟业务场景相关的数据。第三对数据进行标签和分类,如果前三类数据不够的时候,可能会引用一些外部数据,包括今天汇百川分享的客户的点击的数据,你愿意上旅游网站,还是愿意上电商网站,还是愿意上教育网站,这个标签都是可以拿到的,你的标签在移动互联网上也是透明的。最后引用外部数据之后就按照你的业务场景进行筛选数据了,你是找到高富帅,还是找到高风险客户,都根据场景来选。最后金融企业可以通过大数据管理平台把数据引用进来,进行标签化、场景化,进行数据的投放,还有一些应用。

DMP可以认为是阿拉丁神灯,可以帮助你利用数据进行分析。过去金融企业在数字化的过程中采的数据都是做效益提升的,或者是风险控制,现在采了很多行为数据和客户的外部标签数据,这些数据主要是做营销的。


这是我们用DMP的一个场景,我就不具体介绍了。我们可以利用DMP寻找一些贷款客户、理财客户、购买学区房的客户,结合内部数据和外部数据是可以实现的。大家不要对大数据营销有过高的期望性,实际上在市场好最好的推荐引擎是亚马逊,亚马逊整个推荐引擎转化率也不超过8%,大数据营销只是一个概率的问题,转化率其实没有那么高。

三、机器学习在金融行业的实践应用

最后一块,我跟大家分享一下机器学习在金融行业中的应用,我再重复一遍,整个数据科学的成熟度基本上是五个阶段,第一个阶段就是数据的采集,第二个阶段就是数据的表述,就是所谓的标签化,第三个阶段就是数据的挖掘,第四个阶段就是数据的预测,第五个阶段就是通过数据去做决策。

现在我们还处于一个挖掘的阶段,就是聚类分析。过去金融行业都是很强相关的数据,比如说这个人叫什么名字、什么职业、收入多少、学历是什么,我们对已有的信息进行分类,按照年龄预测他可能未来两三年会买车、买房,收入有些增加,会出国旅游等。实际上还有另外一些信息,比如他在社交媒体的信息,网站访问信息和APP上的行为信息、交易信息等。所有的这些信息可以用机器学习,也就是用聚类这种方法进行一些标准的分类。


我们会发现用结构化数据分类的这些人有很大的一个误差,这是为什么?建议大家有时间可以去关注一个学科,现在比较热,叫“行为金融学”。这个行为金融学里面透露一个道理,大家在跟外部沟通的时候,每个人内心会隐藏自己的个性。举个例子,你到金融网点去买理财产品的时候,他让你会填一个你收入多少,你风险承受程度是多少?你是价值投资者,还是风险投资投资者?如果不拿行为信息,仅仅根据客户调查的信息的话,很难判断一个人的投资偏好,或者是个性。

聚类有很多方法,很多模型,比如说基于模型的聚类等等,我基本上选三类以上,根据实际数据的验证效果来决定哪一个模型更适合。因为你的数据纬度、质量是不一样的。


基本上,我们首先利用行为信息进行聚类,完全利用行为信息,发现在金融企业里,客户分三类,一个是僵尸型,注册之后买一支产品就不动了。第二就是一次性买投资的,可能是家庭主妇,买了投资之后放在那儿就不动了,另外就是投资理财型的,非常活跃,利用过去结构化发现不了。利用聚类找的这三类客户之后,针对每一类客户要提供不同的营销手段。


这个是决策树的案例,当摩根收购大通银行的时候,有600亿住房抵押贷款,所有住房抵押贷款的客户都有两个风险,一个风险就是说这些客户不还钱了。第二个风险他提前还款,如果不还款银行就有坏账,如果提前还款银行就没有得到更多的收益,怎么办呢?摩根大通请来了一个叫丹尼尔的科学家花了一百多万美金做了一个分析,能够提前预测哪些客户要提前还款,对这一部分客户就给他推荐一些理财产品,他就会把多余的钱买理财产品,就不会去还他的抵押贷款,银行就有两份收益,一是原来贷款给它产生利息,二是新的理财产品也会给它带来收益。大概运行了一年通过这种决策分析给大通银行创造了6个亿美金的收入。


另外一个是Machine Learning,我们叫Lookalike算法,通过3%的用户去寻找潜在的客户,找到之后再给客户发短信营销,正常的情况下我们短信营销打开率只有0.1%,通过Lookalike计算之后,精准营销的短信打开率达到6.5%,也很另客户吃惊,通过机器学习这种行为数据找到客户比他用结构化数据找到客户可能更真实。


下一个是沃森。沃森2012年开始在美国花旗银行帮很多金融理财客户做顾问,DBS也是2014年开始做保险理财的推荐,它会根据掌握的信息去给客户推荐产品。

当时为什么选沃森呢?因为DBS它有自己一套评估方法,它找到了8个Top 保险理财产品销售跟沃森进行了三轮测试,分别面对三个客户,三轮测试之后。DBS的销售客户推荐了理财产品,沃森也给客户推荐了理财产品,经过三轮的PK最后都是沃森胜了,客户选择了沃森提供的保险理财方案。机器学习在人工智能这方面有天然的优势,因为它可以处理海量的信息。沃森也在推中国的市场,但暂时还有些慢,因为在中国我们知道英语是叫逻辑语言,可以根据一些语言行为判断出你的行为,但是汉语是非逻辑性语言,我们经常开玩笑说“中国队大败美国队”,这句话很难判断是那一方胜利了。

沃森正在做一些认知学的应用,拿历史医疗档案进行一些分析,利用它认知学、人工智能的方式去帮助医生制定一个好的方案。所以沃森和阿尔法狗是人工智能发展的两个比较好的案例。

Machine Learning也可以帮助DMP Plus进行的营销响应、高价值客户挖掘、客户挽留、关联产品分析,这个中国一些大的金融企业已经在做了,比如说一些证券公司。

下面就讲讲在证券行业的应用,伦敦的证券交易所有40%的金融交易是用量化交易,就是机器自己进行交易的。在国内,我们量化交易的市场这几年有了提升,大概有30%,美国是70%的基金都是量化交易基金,在美国TOP100的基金基本上第二年很少再进入TOP100了,因为市场竞争非常激烈,没有一家基金可以长时间保持在TOP100。

约翰·埃尔德建立了一个股票预测的黑盒子,押上了全部身家10年,像一些黑天鹅事件很容易影响股票市场的波动。有一些股票的模型都是用历史交易去做的,如果用历史交易预测未来的话有很大的欺骗性。


下面就是UBI,也是UBI在做金融企业深度学习,或者是Machine Learning常用的一种方式,美国有20%的车险市场定价是UBI决定的,就是基于你的价值行为,比如说你的手机上传感器传的数据到车险APP之后,它会判断你的急刹车、急转弯和行驶道路是否平坦、是否闯红灯,是否边开车边打电话,通过这些数据可以进行一些风控模型的判断,也会对你的价值行为进行一个评分。但中国暂时UBI还没有大规模兴起,未来是一个很大的市场。


今天的分享大概就到这儿,未来机器学习在金融领域应用是非常广阔的,希望大家做数据分析的时候,除了做表格了解之外,也再想想怎么样去预测、去决策,谢谢!

提问:我想问一下封闭性系统和死循环有什么区别?

鲍忠铁:咱们先把概念搞清楚,看看咱们俩了解的概念是不是一样,封闭式系统所有的反馈都是在内部,没有外部,他这个反馈有可能形成死循环,有可能不会形成死循环,反馈没有波动了,没有任何的干扰了,所有的数据输入和数据输出结果都一样。

这种现象可以从两方面解释,第一个就是你的数据的采集,这种情景做模型分析的时候很少能出现,如果你出现这种的话,我们认为就是你的模型有很大的缺陷,会出现一种死循环。第二就是模型在任何的噪声,或者说在任何的脏数据的处理下,不要形成死循环,你的模型在设计的时候要抗死循环。

提问:给用户打标签,建立用户画像之后,其实是对用户深度地去解读,我可能去猜测这个用户的喜好和他的行为习惯做一些推荐,如果我这么做的话,可能会和推荐的多样性有冲突,有没有一些方法,针对用户的多样性。

鲍忠铁:这个问题比较简单一点,她说用户的深度分析之后,就把用户定到一个很小的领域,但是我货架上有一百个产品,我如果给用户定到一个很小的领域的话,那一百个产品就没办法给他了,我只能挑一个商品给他,这样对我来说是不是一个商业上的损失,做用户分析就得不偿失了。

商业分析的时候,我们最终看到的一个结论,增加企业的收入,其实还是你这个商品的销售收入,即使你把客户定到一个很小的领域中,这个客户到了之后你商品的转化率比原来提高了。你有两个选择,要么没定他很细的领域给他推荐一百个产品,最后看他的结果,整个收入提高了,你的深入分析就是有效的,如果你的深度分析之后,他定的收入是降低了,那么你的分析就是有问题的。

实际上换一个角度来说的话,你给用户推荐一百个产品,和给用户推荐五个产品,用户的体验和你推荐的成本是不一样的。所以从这个角度来说的话,我还是强调,通过深度分析对用户的精准分析和精准营销,做精准推荐是一个趋势,这也是现在电商在做的一个事情。你要有一个平衡点,当转化率高于多少的时候我就做精准营销,低于多少的时候我就普通推。

对商业数据分析感兴趣的同学可移步至CDA数据分析师微店了解课程:


 (微店二维码)                       (CDA数据分析师服务号 )

数据分析咨询请扫描二维码

客服在线
立即咨询