为什么量化投资一定要多模型
有些新手会问量化投资为什么这么多模型,,为什么不找一个收益率最高的做?为什么不找一个夏普比率最高的做?我今天来分享一下为什么量化投资必须要多个模型。
首先看几个概念:收益和波动,赔率和概率,优化和过度拟合
收益和波动
“Outperforming the market with low volatility on a consistent basis is an impossibility. I outperformed the market for 30-odd years, but not with low volatility.” ---George Soros
“持续超越市场却保持低的波动性是不可能的事。我在30多年里超越了市场,但波动性却并不低。”---索罗斯
很多职业投资者的目标都是超越市场。但问题在于,大多数投资人都希望长期获得高回报并超越市场,但同时却厌恶短期的大幅度波动。遗憾的是,投资组合的低波动与超越市场的表现不可兼得。
作为衡量市场表现的标准,美国标准普尔500指数从1985年12月底到2000年4月底上涨很多,相当于把100块钱变成了687块钱。但巴菲特则相当于把100块钱变成了4605块钱,远远超越了市场。虽然巴菲特和索罗斯远远超越了市场,其波动性也非常大。超越市场越多的,其波动性也越大。可以说超越市场的代价之一就是大幅度的波动。
从实证的的角度看,很多表现优秀的基金超越市场不是持续稳定的超越,具有稳定的优势,而是在市场不好时超越,在市场狂热时表现一般,甚至逊色。换句话说,战胜市场不是多赢,而是少输。
概率和赔率
概率和赔率的组合就是期望,经常有人说量化朝着大概率的方向做,但有没有想过0.9概率为正但收益是10%,而0.1的概率为负但收益是-99%呢?其实,量化是朝着高期望的方向做,这个例子的期望收益是-0.9%,赌久了肯定亏干净。
很多策略在高夏普比率的背后,统计的时候经常会发生胜率低于50%的情况,背后的原因就是虽然胜率可能偏低,但每次失败后的回撤控制的好,而一旦策略成功后贡献的盈利比例很高,于是整体的期望值较高,符合量化投资选择策略的标准。
优化和过度拟合
通过对上面期望值的筛选后,初选出来的量化模型需要进一步优化,比如测试新参数、测试适应哪些行情等,通过测试不同参数可以得到对历史行情更为有效的策略。也可以根据2011-2013的数据测试出来的参数应用在2014的行情上,这样多次测试后总能挑选出一个比较优化的模型。
值得一提的是,回测策略最需要避免的问题是过度拟合,比如当拿到过去十年的数据后,大致使用10种方案进行回测后发现一种比较有效,然后以此为基础分析了10种改进,再选出一个进行改进,无数次改进后总能做到一个对过去数据无比有效的方案,可这种方案不会有任何参考价值,因为其对历史数据过度拟合了。
量化的本质
若能开发足够多的模型,每个模型分配一定比例的仓位,各自根据系统信号独自运作,那么整体资金曲线就不会大起大落。
对于每一个交易策略来看,要想获得高收益必定承受高波动,对其优化的时候两者一定无法兼顾,且时间轴上来看无法做到适应所有的行情。由于交易策略不会适应所有的市场行情,所以在某一个策略无效时,不会给整个资金带来致命损失,所以管理人要经常测试所有的模型,以及时调整参数、删减模型、增加模型。
文中第一部分论述高收益和低波动是矛盾的,第二部分讲概率和赔率的矛盾,第三部分讲优化与过度拟合的矛盾。所有想表达的,化作一句话就是没有一劳永逸的交易系统,追求在所有行情下都合适的交易系统是徒劳的。选择不同交易策略的时候最好使得其有一定的互补性,也就是降低其相关系数,这样多套系统同时运作会降低标准差,获取更高的夏普比率。
数据分析咨询请扫描二维码
CDA数据分析师在中国航信高科技产业园进行了面向测试度量的数据分析培训课程,培训人数近2 ...
2024-05-01CDA数据分析师走进深圳迈瑞生物医疗电子股份有限公司,在迈瑞总部展开了为期两天的培训,本次课程参训人员线上及线下近百人, ...
2024-05-01CDA数据分析师在合肥市对合肥阳光新能源科技有限公司开展了为期8天的企业内训。 合肥阳光新能源科技 ...
2024-05-01CDA数据分析师走进海尔大学,进行了《数据治理与数据中台建设的道与术》专题培训,培训现场爆满,近百人参加了此次培训。 ...
2024-05-01在中国银行苏州分行培训中心开始数据分析师培训,此次培训课程共10天内容,包括Excel、MySQL、概率论与数理统计、SPSS等内容, ...
2024-05-01从实际的业务需求出发,结合行业的典型应用特点,围绕实际的商业问题,探讨数据挖掘、机器学习模型在金融领域的应用,包括获客、信用评分、细分画像、交叉销售、反欺诈、违规识别、时序预测、运筹优化、流程挖掘九个方面,形成 ...
2024-05-01本次培训课程为线上+线下的模式,由于学员编程能力不一、部分学员没有编程基础,故提供统计学、python基 ...
2024-05-01华夏银行信用卡中心-机器学习培训 1、课程亮点 取材于业界一流企业和顶级咨询公司的行业实践;已经被证明是人人 ...
2024-05-01主 题:数据中台建设及数据分析应用主题分享 1. 数据中台市场洞察 2. 主流数据中台产品比较 3. 某企业数据中 ...
2024-05-01围绕“数据驱动”战略,全力打造我行 300 人数字化人才梯队,着力培养数字化管理人才、大数据专业团队 ...
2024-05-01在当今数据驱动的商业环境中,数据分析成为了企业决策的重要依据。通过对大量数据的收集、处理和分析,企业能够更好地理解市场 ...
2024-04-29在人工智能(AI)的世界里,提示词(Prompt)是一种强大的工具,它能够引导AI按照用户的需求产生特定的输出。本文将深入探讨AI ...
2024-04-29CDA立足未来职场,拓展前沿视野——对外经贸大学保险学院举办“三全育人大讲堂”分享行业最新动态。 ...
2024-04-294月2日,CDA数据分析师创始发起人兼协会理事长赵坚毅博士受邀在浙江万里学院举办了一场以“数字化能力在职场中的作用” ...
2024-04-29随机森林(Random Forests)现在机器学习中比较火的一个算法,是一种基于Bagging的集成学习方法,能够很好地处理分类和回归的问 ...
2022-12-23方差分析是数据分析中常用的一种统计分析方法,接下来让我们简单了解一下方差分析的基本思想和原理吧。 方差分析(Analysis ...
2022-12-23来源:关于数据分析与可视化 关于streamlit-aggrid 数据排序 表格样式的调整 数据 ...
2022-08-03作者:麦叔 定义 「把上面晦涩的概念汇成一句话就是:」 ❝ 回调函数就是一个被作为参 ...
2022-08-03现今,高学历人群日益增多,物以稀为贵的高学历光环淡去。无论本科生还是研究生,甚至博士生,求职竞争力都大不如前,就业压力越来越大。
2022-06-01某家企业10个人面试,有9个本科生……如何脱颖而出,除得体的举止和良好的沟通力外,证书成重要筹码,这也是很多人考证的关键所在。
2022-04-14