为什么量化投资一定要多模型-CDA数据分析师官网

热线电话：13121318867

为什么量化投资一定要多模型

2018-05-16

为什么量化投资一定要多模型

有些新手会问量化投资为什么这么多模型，，为什么不找一个收益率最高的做？为什么不找一个夏普比率最高的做？我今天来分享一下为什么量化投资必须要多个模型。

首先看几个概念：收益和波动，赔率和概率，优化和过度拟合

收益和波动

“Outperforming the market with low volatility on a consistent basis is an impossibility. I outperformed the market for 30-odd years, but not with low volatility.” ---George Soros

“持续超越市场却保持低的波动性是不可能的事。我在30多年里超越了市场，但波动性却并不低。”---索罗斯

很多职业投资者的目标都是超越市场。但问题在于，大多数投资人都希望长期获得高回报并超越市场，但同时却厌恶短期的大幅度波动。遗憾的是，投资组合的低波动与超越市场的表现不可兼得。

作为衡量市场表现的标准，美国标准普尔500指数从1985年12月底到2000年4月底上涨很多，相当于把100块钱变成了687块钱。但巴菲特则相当于把100块钱变成了4605块钱，远远超越了市场。虽然巴菲特和索罗斯远远超越了市场，其波动性也非常大。超越市场越多的，其波动性也越大。可以说超越市场的代价之一就是大幅度的波动。

从实证的的角度看，很多表现优秀的基金超越市场不是持续稳定的超越，具有稳定的优势，而是在市场不好时超越，在市场狂热时表现一般，甚至逊色。换句话说，战胜市场不是多赢，而是少输。

概率和赔率

概率和赔率的组合就是期望，经常有人说量化朝着大概率的方向做，但有没有想过0.9概率为正但收益是10%，而0.1的概率为负但收益是-99%呢？其实，量化是朝着高期望的方向做，这个例子的期望收益是-0.9%，赌久了肯定亏干净。

很多策略在高夏普比率的背后，统计的时候经常会发生胜率低于50%的情况，背后的原因就是虽然胜率可能偏低，但每次失败后的回撤控制的好，而一旦策略成功后贡献的盈利比例很高，于是整体的期望值较高，符合量化投资选择策略的标准。

优化和过度拟合

通过对上面期望值的筛选后，初选出来的量化模型需要进一步优化，比如测试新参数、测试适应哪些行情等，通过测试不同参数可以得到对历史行情更为有效的策略。也可以根据2011-2013的数据测试出来的参数应用在2014的行情上，这样多次测试后总能挑选出一个比较优化的模型。

值得一提的是，回测策略最需要避免的问题是过度拟合，比如当拿到过去十年的数据后，大致使用10种方案进行回测后发现一种比较有效，然后以此为基础分析了10种改进，再选出一个进行改进，无数次改进后总能做到一个对过去数据无比有效的方案，可这种方案不会有任何参考价值，因为其对历史数据过度拟合了。

量化的本质

若能开发足够多的模型，每个模型分配一定比例的仓位，各自根据系统信号独自运作，那么整体资金曲线就不会大起大落。

对于每一个交易策略来看，要想获得高收益必定承受高波动，对其优化的时候两者一定无法兼顾，且时间轴上来看无法做到适应所有的行情。由于交易策略不会适应所有的市场行情，所以在某一个策略无效时，不会给整个资金带来致命损失，所以管理人要经常测试所有的模型，以及时调整参数、删减模型、增加模型。

文中第一部分论述高收益和低波动是矛盾的，第二部分讲概率和赔率的矛盾，第三部分讲优化与过度拟合的矛盾。所有想表达的，化作一句话就是没有一劳永逸的交易系统，追求在所有行情下都合适的交易系统是徒劳的。选择不同交易策略的时候最好使得其有一定的互补性，也就是降低其相关系数，这样多套系统同时运作会降低标准差，获取更高的夏普比率。

CDA数据分析师考试相关入口一览（建议收藏）：

▷ 想报名CDA认证考试，点击>>> “CDA报名” 了解CDA考试详情；