京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据挖掘投资大师的秘诀_数据分析师
先谈巴菲特
投资当如巴菲特。巴菲特从11岁开始第一次买股票,买了三股给自己,三股给自己的姐姐。到20世纪50年代初,时年20岁出头且已经有几千美金的巴菲特开始了自己的职业投资人生涯。半个多世纪后,2008年他成为了世界上最富有的人。
他在投资上做得有多好呢?如果把巴菲特的投资当作一只股票,并把这只股票和1926至2011年间美国所有存活30年以上的股票相比,那么这只股票相对于其波动性而言有最高的回报率(投资界所谓的夏普比率);按同样的指标,巴菲特也打赢了美国历史上所有有30年以上历史的公募基金。简而言之,巴菲特被公认为20世纪最伟大的投资者是当之无愧的。
如果写这篇文章的目的只是为了赞美,那么笔者可以就此打住,因为同样的主题已经被全世界的投资者唱了千万遍。相反,笔者想讨论的是一个所有投资者都关心、却可能不知道答案的问题:巴菲特被尊为奥马哈的“鬼才”、“先知”和“贤人”,而这位鬼才的杰出业绩有多少是基于“如得神助”的个人选股能力,有多少是基于可复制的普遍投资规律?
对这个问题的探讨是十分重要的。在每个国家的投资界,都流传着某些慧眼挑股票,大赚几十倍,让人羡慕嫉妒恨的故事;另一方面,一个关于基金投资的普遍规律是业绩不可持续。优秀的投资人同时也拥有卓越的投资能力吗?如果有,为什么一般基金的业绩不能持续?如果有,这种能力是对普遍投资规律的掌握,还是来自 “可欲而不可求”的个人素质?笔者认为,对最伟大的投资者的研究可以帮助我们理解投资的本质。
最近三位美国金融经济学家(Frazzini、Kabiller和Pedersen)研究发现,巴菲特的投资成绩源自三个方面:第一,巴菲特喜欢挑选周期性低(和大市关联度低)、便宜(市盈率或市净率低)、质量高(赚钱、稳定、有增长并分红)的股票;第二,巴菲特能够在逆市时坚持其投资理念。更重要的是,由于其卓越的声誉,投资者能够耐心地陪伴他而不是抛弃他;第三,巴菲特通过保险浮存金和发行债券来放大杠杆。这样一方面增大了波动性,另外一方面也放大了收益。
这些策略可以复制吗?上面的研究发现,如果时光倒流,在巴菲特投资的时期按照这几个规则选择非常分散的股票组合,并使用同等的杠杆,结果发现一些与巴菲特投资组合有所不同的股票组合,其最后的回报率甚至可以超过巴菲特。
换而言之,巴菲特的成功源自他采用了符合普遍投资规律的策略,通过杠杆放大收益,并能坚守这些策略。这个发现并不贬损世界上最伟大投资家的光辉,但确实把他从神座上拉下来了。他的成就总体而言是符合了投资规律,而非不可言喻的“天人”之作。
读到此处,估计一些投资者会嘿嘿一笑,然后对笔者说:“你说的是美国吧?”中国的A股市场以波动大、政策市、操纵市着称。这个市场似乎没有多少规律可循,倒是盛传各种因为内幕、操纵等原因而发财的故事。那么在这样一个貌似混乱的市场里,我们还能够透过规律去分析投资者吗?
再谈王亚伟
中国过去十年最有名的公募基金投资者是王亚伟,号称“一哥”,曾经长期是中国最大的华夏基金的投资经理,并有力支持了华夏基金的成长。他2007年获得 “中国最赚钱的基金经理”的殊荣,2009年当选“股基王”,2010和2011年连续两年当选《福布斯》中国十佳基金经理第一名。
关于王亚伟的传闻很多,包括超常的选股能力,神奇的押宝重组股的能力,甚至有内幕消息、基金对倒等不详传闻。那么我们应该如何看待他呢?是把他归为不可理喻的“鬼才”,有不可言说的故事,还是可以用投资规律去分析他的投资表现呢?
王亚伟曾经担任三个公募基金的经理:华夏成长(2001年12月至2005年4月)、华夏大盘(2005年12月至2012年5月)和华夏策略(2008 年10月至2012年5月),其中华夏大盘和华夏策略在2008至2012年间同时运作。所以我们可以把王亚伟的投资经历分成三个阶段:2002年至 2005年,2005年至2008年,2008年至2012年。
从2002年1月到2005年4月间,王亚伟担任华夏成长经理。在这个时期,华夏成长的回报率累积跑输所有非华夏系基金平均回报率的8.7%。也就是说,王亚伟的“成长”阶段并不出彩。
王亚伟最成功的经历是担任华夏大盘的经理。从2005年12月到2012年5月,如果我们把所有A股上市公司的简单平均回报率作为指数,叫做全A平均指数,那么华夏大盘累计跑赢全A平均指数564%(图二)。
仔细研究会发现,这个超额业绩的基础主要是在2005年12月到2008年10月(第二阶段)完成的。实际上,从2008年10月到2012年5月,即王亚伟同时管理华夏大盘和华夏策略的阶段,两只基金都跑输了全A平均指数。其中华夏大盘跑输36%,华夏策略跑输70%(图三)。
另外,笔者发现剔除重组股对王亚伟的基金回报率影响不大,所以押宝重组股并不是他成功的决定性原因。华夏成长与华夏策略的回报率相关性达到99%,这也说明这两只基金的选股方式非常类似,破除了基金对倒的传言。
行文至此,笔者认为作为中国最着名的基金经理人,王亚伟的成功并不是基于押宝重组股或基金之间的交易。而从数据中我们可以得出一个重要的结论,即王亚伟的超常业绩并不持续,这与国际惯例相同。实际上,如果把他的业绩分成三段,那么2002至2005年间他不如一般基金表现的那么出彩,2005年至2008 年间非常出彩,2008年至2012年间则跑输上市公司的平均回报率。
这个研究说明了投资的几个基本规律:其一,即便是好的投资人,其业绩也有波动,决定谁是最好的投资人可能需要很长的时间;其二,追随传说中带有神秘色彩的投资故事并不是学习投资的最佳方式。这些神秘的投资故事可能并不像想象的那么有效,而真正能够持续盈利的故事(如巴菲特)往往是可以印证的普遍投资规律。
需要指出的是,在计算全A平均指数时考虑了所有股票,包括相对市值小的股票。从表面上看,全A平均指数和华夏大盘的直接对比可能并不是最合适的,但在实际运作中,华夏大盘改变了基金公约,配置了不少中小股,因此两者之间具有了一定的可比性。
另外,国际资本市场的一个重要普遍规律是小盘股回报率超过大盘股。王亚伟2008年至2012年的经验表明,与其相信神神秘秘的投资故事,不如遵循投资规律买一些分散的小盘股。
小数据和大数据
在充满了不确定性的投资领域里,学习投资的方式也体现着人性,其具体表现为投资者喜欢追逐有个人色彩的传奇故事,力图挖掘投资大师的秘诀。对此,我们不妨称之为小数据的学习方式,即通过个别案例来学习。这里有几个关键问题,一是故事是否有普遍性,二是故事是否印证了投资的基本规律。没有大数据的印证,故事往往发展成神话或阴谋论,于学习无益。
在大数据分析的光亮底下,笔者意图和大家讨论的关键问题是投资是否可学。在任何一个时点,如同掷骰子,都有投资者欢呼或哭泣。那么持续成功所需要的,是不可学的神迹,还是可学的普遍规律?于巴菲特,他的长期成功来自于坚守合理的投资理念,值得分享借鉴。于王亚伟,他还需要更长的时间来验证自己是否是最出色的投资者。于我们,可以从对两个着名投资者的分析中学到,神妙不可学的投资方法,并不是他们持续成功的原因。这是一个好消息。
投资可学,用巴菲特自己的话来说,投资的真谛是把股票当作企业(有长线眼光)来看,利用市场的波动性,在合理的安全边际买进高质量的股票。这样的道理,“一百年后仍然是投资的基石”。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在实验检测、质量控制、科研验证等场景中,“方法验证”是确保检测/分析结果可靠、可复用的核心环节——无论是新开发的检测方法 ...
2026-03-04在数据分析、科研实验、办公统计等场景中,我们常常需要对比两组数据的整体差异——比如两种营销策略的销售额差异、两种实验方案 ...
2026-03-04在数字化转型进入深水区的今天,企业对数据的依赖程度日益加深,而数据治理体系则是企业实现数据规范化、高质量化、价值化的核心 ...
2026-03-04在深度学习,尤其是卷积神经网络(CNN)的实操中,转置卷积(Transposed Convolution)是一个高频应用的操作——它核心用于实现 ...
2026-03-03在日常办公、数据分析、金融理财、科研统计等场景中,我们经常需要计算“平均值”来概括一组数据的整体水平——比如计算月度平均 ...
2026-03-03在数字化转型的浪潮中,数据已成为企业最核心的战略资产,而数据治理则是激活这份资产价值的前提——没有规范、高质量的数据治理 ...
2026-03-03在Excel办公中,数据透视表是汇总、分析繁杂数据的核心工具,我们常常通过它快速得到销售额汇总、人员统计、业绩分析等关键结果 ...
2026-03-02在日常办公和数据分析中,我们常常需要探究两个或多个数据之间的关联关系——比如销售额与广告投入是否正相关、员工出勤率与绩效 ...
2026-03-02在数字化运营中,时间序列数据是CDA(Certified Data Analyst)数据分析师最常接触的数据类型之一——每日的营收、每小时的用户 ...
2026-03-02在日常办公中,数据透视表是Excel、WPS等表格工具中最常用的数据分析利器——它能快速汇总繁杂数据、挖掘数据关联、生成直观报表 ...
2026-02-28有限元法(Finite Element Method, FEM)作为工程数值模拟的核心工具,已广泛应用于机械制造、航空航天、土木工程、生物医学等多 ...
2026-02-28在数字化时代,“以用户为中心”已成为企业运营的核心逻辑,而用户画像则是企业读懂用户、精准服务用户的关键载体。CDA(Certifi ...
2026-02-28在Python面向对象编程(OOP)中,类方法是构建模块化、可复用代码的核心载体,也是实现封装、继承、多态特性的关键工具。无论是 ...
2026-02-27在MySQL数据库优化中,索引是提升查询效率的核心手段—— 面对千万级、亿级数据量,合理创建索引能将查询时间从秒级压缩到毫秒级 ...
2026-02-27在数字化时代,企业积累的海量数据如同散落的珍珠,若缺乏有效的梳理与分类,终将难以发挥实际价值。CDA(Certified Data Analys ...
2026-02-27在问卷调研中,我们常遇到这样的场景:针对同一批调查对象,在不同时间点(如干预前、干预后、随访期)发放相同或相似的问卷,收 ...
2026-02-26在销售管理的实操场景中,“销售机会”是核心抓手—— 从潜在客户接触到最终成交,每一个环节都藏着业绩增长的关键,也暗藏着客 ...
2026-02-26在CDA数据分析师的日常工作中,数据提取、整理、加工是所有分析工作的起点,而“创建表”与“创建视图”,则是数据库操作中最基 ...
2026-02-26在机器学习分析、数据决策的全流程中,“数据质量决定分析价值”早已成为行业共识—— 正如我们此前在运用机器学习进行分析时强 ...
2026-02-25在数字化时代,数据已成为企业决策、行业升级的核心资产,但海量杂乱的原始数据本身不具备价值—— 只有通过科学的分析方法,挖 ...
2026-02-25