京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据挖掘投资大师的秘诀_数据分析师
先谈巴菲特
投资当如巴菲特。巴菲特从11岁开始第一次买股票,买了三股给自己,三股给自己的姐姐。到20世纪50年代初,时年20岁出头且已经有几千美金的巴菲特开始了自己的职业投资人生涯。半个多世纪后,2008年他成为了世界上最富有的人。
他在投资上做得有多好呢?如果把巴菲特的投资当作一只股票,并把这只股票和1926至2011年间美国所有存活30年以上的股票相比,那么这只股票相对于其波动性而言有最高的回报率(投资界所谓的夏普比率);按同样的指标,巴菲特也打赢了美国历史上所有有30年以上历史的公募基金。简而言之,巴菲特被公认为20世纪最伟大的投资者是当之无愧的。
如果写这篇文章的目的只是为了赞美,那么笔者可以就此打住,因为同样的主题已经被全世界的投资者唱了千万遍。相反,笔者想讨论的是一个所有投资者都关心、却可能不知道答案的问题:巴菲特被尊为奥马哈的“鬼才”、“先知”和“贤人”,而这位鬼才的杰出业绩有多少是基于“如得神助”的个人选股能力,有多少是基于可复制的普遍投资规律?
对这个问题的探讨是十分重要的。在每个国家的投资界,都流传着某些慧眼挑股票,大赚几十倍,让人羡慕嫉妒恨的故事;另一方面,一个关于基金投资的普遍规律是业绩不可持续。优秀的投资人同时也拥有卓越的投资能力吗?如果有,为什么一般基金的业绩不能持续?如果有,这种能力是对普遍投资规律的掌握,还是来自 “可欲而不可求”的个人素质?笔者认为,对最伟大的投资者的研究可以帮助我们理解投资的本质。
最近三位美国金融经济学家(Frazzini、Kabiller和Pedersen)研究发现,巴菲特的投资成绩源自三个方面:第一,巴菲特喜欢挑选周期性低(和大市关联度低)、便宜(市盈率或市净率低)、质量高(赚钱、稳定、有增长并分红)的股票;第二,巴菲特能够在逆市时坚持其投资理念。更重要的是,由于其卓越的声誉,投资者能够耐心地陪伴他而不是抛弃他;第三,巴菲特通过保险浮存金和发行债券来放大杠杆。这样一方面增大了波动性,另外一方面也放大了收益。
这些策略可以复制吗?上面的研究发现,如果时光倒流,在巴菲特投资的时期按照这几个规则选择非常分散的股票组合,并使用同等的杠杆,结果发现一些与巴菲特投资组合有所不同的股票组合,其最后的回报率甚至可以超过巴菲特。
换而言之,巴菲特的成功源自他采用了符合普遍投资规律的策略,通过杠杆放大收益,并能坚守这些策略。这个发现并不贬损世界上最伟大投资家的光辉,但确实把他从神座上拉下来了。他的成就总体而言是符合了投资规律,而非不可言喻的“天人”之作。
读到此处,估计一些投资者会嘿嘿一笑,然后对笔者说:“你说的是美国吧?”中国的A股市场以波动大、政策市、操纵市着称。这个市场似乎没有多少规律可循,倒是盛传各种因为内幕、操纵等原因而发财的故事。那么在这样一个貌似混乱的市场里,我们还能够透过规律去分析投资者吗?
再谈王亚伟
中国过去十年最有名的公募基金投资者是王亚伟,号称“一哥”,曾经长期是中国最大的华夏基金的投资经理,并有力支持了华夏基金的成长。他2007年获得 “中国最赚钱的基金经理”的殊荣,2009年当选“股基王”,2010和2011年连续两年当选《福布斯》中国十佳基金经理第一名。
关于王亚伟的传闻很多,包括超常的选股能力,神奇的押宝重组股的能力,甚至有内幕消息、基金对倒等不详传闻。那么我们应该如何看待他呢?是把他归为不可理喻的“鬼才”,有不可言说的故事,还是可以用投资规律去分析他的投资表现呢?
王亚伟曾经担任三个公募基金的经理:华夏成长(2001年12月至2005年4月)、华夏大盘(2005年12月至2012年5月)和华夏策略(2008 年10月至2012年5月),其中华夏大盘和华夏策略在2008至2012年间同时运作。所以我们可以把王亚伟的投资经历分成三个阶段:2002年至 2005年,2005年至2008年,2008年至2012年。
从2002年1月到2005年4月间,王亚伟担任华夏成长经理。在这个时期,华夏成长的回报率累积跑输所有非华夏系基金平均回报率的8.7%。也就是说,王亚伟的“成长”阶段并不出彩。
王亚伟最成功的经历是担任华夏大盘的经理。从2005年12月到2012年5月,如果我们把所有A股上市公司的简单平均回报率作为指数,叫做全A平均指数,那么华夏大盘累计跑赢全A平均指数564%(图二)。
仔细研究会发现,这个超额业绩的基础主要是在2005年12月到2008年10月(第二阶段)完成的。实际上,从2008年10月到2012年5月,即王亚伟同时管理华夏大盘和华夏策略的阶段,两只基金都跑输了全A平均指数。其中华夏大盘跑输36%,华夏策略跑输70%(图三)。
另外,笔者发现剔除重组股对王亚伟的基金回报率影响不大,所以押宝重组股并不是他成功的决定性原因。华夏成长与华夏策略的回报率相关性达到99%,这也说明这两只基金的选股方式非常类似,破除了基金对倒的传言。
行文至此,笔者认为作为中国最着名的基金经理人,王亚伟的成功并不是基于押宝重组股或基金之间的交易。而从数据中我们可以得出一个重要的结论,即王亚伟的超常业绩并不持续,这与国际惯例相同。实际上,如果把他的业绩分成三段,那么2002至2005年间他不如一般基金表现的那么出彩,2005年至2008 年间非常出彩,2008年至2012年间则跑输上市公司的平均回报率。
这个研究说明了投资的几个基本规律:其一,即便是好的投资人,其业绩也有波动,决定谁是最好的投资人可能需要很长的时间;其二,追随传说中带有神秘色彩的投资故事并不是学习投资的最佳方式。这些神秘的投资故事可能并不像想象的那么有效,而真正能够持续盈利的故事(如巴菲特)往往是可以印证的普遍投资规律。
需要指出的是,在计算全A平均指数时考虑了所有股票,包括相对市值小的股票。从表面上看,全A平均指数和华夏大盘的直接对比可能并不是最合适的,但在实际运作中,华夏大盘改变了基金公约,配置了不少中小股,因此两者之间具有了一定的可比性。
另外,国际资本市场的一个重要普遍规律是小盘股回报率超过大盘股。王亚伟2008年至2012年的经验表明,与其相信神神秘秘的投资故事,不如遵循投资规律买一些分散的小盘股。
小数据和大数据
在充满了不确定性的投资领域里,学习投资的方式也体现着人性,其具体表现为投资者喜欢追逐有个人色彩的传奇故事,力图挖掘投资大师的秘诀。对此,我们不妨称之为小数据的学习方式,即通过个别案例来学习。这里有几个关键问题,一是故事是否有普遍性,二是故事是否印证了投资的基本规律。没有大数据的印证,故事往往发展成神话或阴谋论,于学习无益。
在大数据分析的光亮底下,笔者意图和大家讨论的关键问题是投资是否可学。在任何一个时点,如同掷骰子,都有投资者欢呼或哭泣。那么持续成功所需要的,是不可学的神迹,还是可学的普遍规律?于巴菲特,他的长期成功来自于坚守合理的投资理念,值得分享借鉴。于王亚伟,他还需要更长的时间来验证自己是否是最出色的投资者。于我们,可以从对两个着名投资者的分析中学到,神妙不可学的投资方法,并不是他们持续成功的原因。这是一个好消息。
投资可学,用巴菲特自己的话来说,投资的真谛是把股票当作企业(有长线眼光)来看,利用市场的波动性,在合理的安全边际买进高质量的股票。这样的道理,“一百年后仍然是投资的基石”。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据仓库与数据分析体系中,维度表与事实表是构建结构化数据模型的核心组件,二者如同“骨架”与“血肉”,协同支撑起各类业务 ...
2026-01-16在游戏行业“存量竞争”的当下,玩家留存率直接决定游戏的生命周期与商业价值。一款游戏即便拥有出色的画面与玩法,若无法精准识 ...
2026-01-16为配合CDA考试中心的 2025 版 CDA Level III 认证新大纲落地,CDA 网校正式推出新大纲更新后的第一套官方模拟题。该模拟题严格遵 ...
2026-01-16在数据驱动决策的时代,数据分析已成为企业运营、产品优化、业务增长的核心工具。但实际工作中,很多数据分析项目看似流程完整, ...
2026-01-15在CDA(Certified Data Analyst)数据分析师的日常工作中,“高维数据处理”是高频痛点——比如用户画像包含“浏览次数、停留时 ...
2026-01-15在教育测量与评价领域,百分制考试成绩的分布规律是评估教学效果、优化命题设计的核心依据,而正态分布则是其中最具代表性的分布 ...
2026-01-15在用户从“接触产品”到“完成核心目标”的全链路中,流失是必然存在的——电商用户可能“浏览商品却未下单”,APP新用户可能“ ...
2026-01-14在产品增长的核心指标体系中,次日留存率是当之无愧的“入门级关键指标”——它直接反映用户对产品的首次体验反馈,是判断产品是 ...
2026-01-14在CDA(Certified Data Analyst)数据分析师的业务实操中,“分类预测”是高频核心需求——比如“预测用户是否会购买商品”“判 ...
2026-01-14在数字化时代,用户的每一次操作——无论是电商平台的“浏览-加购-下单”、APP的“登录-点击-留存”,还是金融产品的“注册-实名 ...
2026-01-13在数据驱动决策的时代,“数据质量决定分析价值”已成为行业共识。数据库、日志系统、第三方平台等渠道采集的原始数据,往往存在 ...
2026-01-13在CDA(Certified Data Analyst)数据分析师的核心能力体系中,“通过数据建立模型、实现预测与归因”是进阶关键——比如“预测 ...
2026-01-13在企业数字化转型过程中,业务模型与数据模型是两大核心支撑体系:业务模型承载“业务应该如何运转”的逻辑,数据模型解决“数据 ...
2026-01-12当前手游市场进入存量竞争时代,“拉新难、留存更难”成为行业普遍痛点。对于手游产品而言,用户留存率不仅直接决定产品的生命周 ...
2026-01-12在CDA(Certified Data Analyst)数据分析师的日常工作中,“挖掘变量间的关联关系”是高频核心需求——比如判断“用户停留时长 ...
2026-01-12在存量竞争时代,用户流失率直接影响企业的营收与市场竞争力。无论是电商、互联网服务还是金融行业,提前精准预测潜在流失用户, ...
2026-01-09在量化投资领域,多因子选股是主流的选股策略之一——其核心逻辑是通过挖掘影响股票未来收益的各类因子(如估值、成长、盈利、流 ...
2026-01-09在CDA(Certified Data Analyst)数据分析师的工作场景中,分类型变量的关联分析是高频需求——例如“用户性别与商品偏好是否相 ...
2026-01-09数据库中的历史数据,是企业运营过程中沉淀的核心资产——包含用户行为轨迹、业务交易记录、产品迭代日志、市场活动效果等多维度 ...
2026-01-08在电商行业竞争日趋激烈的当下,数据已成为驱动业务增长的核心引擎。电商公司的数据分析师,不仅是数据的“解读官”,更是业务的 ...
2026-01-08