因子模型举例：主成分分析-CDA数据分析师官网

热线电话：13121318867

因子模型举例：主成分分析

2018-08-26

因子模型举例：主成分分析

我之前提到的因子风险主要包括经济的(知利率)、基本面的(如账面市值比率)和技术的(如前期收益率)。获得一个包含大童股票的投资组合因子风险的历史数据，并用于对因子模型进行回测，对于独立交易员来说是非常昂贵且不切实际的。不过，有一种因子模型，其构建只依核于历史收益率。这个方法叫做主成分分析(PCA)。

用主成分分析构建因子风险和因子收益率，必须假设因子风险在估计的时间段内是不变的(时间独立)。(这排除了表示均值回归或惯性的因子，因为这些因子风险都与前期收益率有关)。更重要的是，如果假设因子收益率之间“不相关”，协方差矩阵bbT就是对角矩阵。如果用协方差矩阵RRT的特征向量作为APT方程R=Xb+u中矩阵X的列向量，可知bbT的确是对角矩阵，并且矩阵RRT的特征值正好扰是因子收益率b的方差。但是，如果因子数量与股票数量相等，我们就不需要使用因子分析了，因为只要选取几个具有较大特征位的特征向黄就能构成矩阵X。特征向量的个数是一个需要优化的交易模型参数。

下面的MATLAB程序展示了一个对S&P60。小盘股使用主成分分析的可能交易策略。这一策略仅设因于收益率具有惯性，即从本期到下期。因于收益率的值保持不变。因此，可以买入基于这些因子的期望收益率最高的股票，卖出期望收益率最低的股票。如果发现这一策略的平均收益率为负，表明对收益率具有惯性的假设是不合适的，或者策略的特有收益率太大了以至于策略失效。

clear;

%使用回望交易日作为佑计区间(训练集)，以此来决定因子风险

%回望期交易日为252天，因子5个

%交易策略为：购买下一个交易日期望收益率最高的50只股票topN = 50；

%选用SP600小盘股做测试(此MATLAB二进制辑入丈件包含交易日，股票，开盘价，最高价，最低价，收盘价)

load('IJR 20080114');

mycls=fillMissingData(cl);

positionsTable=zeros (size(cl));

写dailyret的行是在不同时间段上的观察值

dailyret=(mycls一lagl(mycls))/lagl(mycls)；

for t=lookback+1:length(tday)

% R的列是不同的观刻对象

R=dailyret(t-lookback+一:t.:)’;

%不考虑所有收益率缺失的股票

hasData=find(all(isfinite(R)，2));

R=R(hasData,:);

avgR=smartmean(R,2);

%移去均值

R=R-repmat(avgR，[1 size(R,2)]);

%计算不同股票收益率的协方差拒阵

covR= smartcov(R')；

% X是因子风险矩阵，B是因子收益率的方差

%用covR的特征值作为X的列向量

[X,B]=eig(covR);

%保留的因子数为numFactors

X(:，1:size(X，2)-numFactors) =[];

% b是从时间t-1到t的因子收益率

results=ols(R(:，end)，X);b= results.beta;

% Rexp是假设因子收益率保持常数时。下一个时间段的期望收益率

Rexp=avgR+X*b;

[foo idxSort]=sort(Rexp，'ascend');

%做空期望收益率最低的50只股票

positionsTable(t，hasData(idxSort(1:topN)))=-1;

%做多期望收益率最高的50只股票

positionsTable(t,. ..

hasData(idxSort(end-opN+1:end)))=1;

end

%计算交易策略的每日收益率

ret=...

smartsum(backshift(1，positionsTable).*dailyret,2);

%计算交易策略的年化收益率

avgret=smartmean(ret)*252%收益率很低

%avgret=

%-1.8099

程序中使用了smartcov函数来计算多只股票日收益平向量的协方差矩阵。与MATLAB内置的cov函数不同，smartcov函数忽略了收益率缺失的交易日(包括NaN值)。

function y=smartcov(x)

% n个有限元素的协方差

% 行为观测值，列为变量

% 用N标准化，而非N-1

y= NaN (size(x,2) , size(x, 2 ));

xc= NaN(size(x));

goodstk=find(～all(isnan(x)，1));

xc(:，goodstk)=...

x(:,goodstk)-repmat(smartmean(x(:,goodstk)，1)，...

[size(x,1)1];%移去均值

for m=1:length(goodstk)

for n=m:length(goodstk)

y(goodstk(m),goodstk(n))=...

smartmean(xc(:，goodstk(m)).

*..xc(:，goodstk(n)));

y(goodstk(n),goodstk(m))=y(goodstk(m) ,goodstk(n));

end

CDA数据分析师考试相关入口一览（建议收藏）：

▷ 想报名CDA认证考试，点击>>> “CDA报名” 了解CDA考试详情；

▷ 想学习CDA考试教材，点击>>> “CDA教材” 了解CDA考试教材；

▷ 想加入CDA考试题库，点击>>> “CDA题库” 了解CDA考试题库；

▷ 想了解CDA考试含金量，点击>>> “CDA含金量” 了解CDA考试详情；

▷ 想了解CDA院校合作，点击>>> “院校合作” 了解咨询CDA院校合作；

特征特征向量 PCA

数据分析咨询请扫描二维码

若不方便扫码，搜微信号：CDAshujufenxi

上一篇趁热再说几句区块链

下一篇如何让用户留下来并产生价值

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

京公网安备 11010802034615号经营许可证编号：京B2-20210330

联系电话：13321103290 (微信同号)

客服在线

立即咨询

客服在线

立即咨询

免密码登录

提交首次登录验证后自动注册

因子模型举例：主成分分析

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

【CDA干货】Power BI函数大全：分类、实操与实战全 ...

【CDA干货】次日留存率计算公式：原理、实操与应用 ...

指标的基本概念：CDA数据分析师的实操根基与洞察抓 ...

【CDA干货】随机森林特征重要性：原理、实操与应用 ...

【CDA干货】MySQL按日期分组：保证每天都有数据，无 ...

描述性统计：CDA数据分析师的入门必修课，让数据特 ...

【马年宠粉｜集赞0元领】转发CDA真题海报，水杯/颈 ...

【CDA干货】Anaconda下载库慢？3种实操方法，彻底解 ...

【CDA干货】Tableau两表未连接部分显示0而非Null： ...

统计基本概念：CDA数据分析师的实操根基与价值落地 ...

【CDA干货】一文读懂如何规避数据滥用风险：全流程 ...

【CDA干货】小样本配对数据：Wilcoxon检验与配对样 ...

透视分析方法：CDA数据分析师的核心实操工具与价值 ...

【CDA干货】一文搞定SQL字段varchar转double：语法 ...

【CDA干货】一文搞定数据透视表两列相互计算：从基 ...

表结构数据的获取、加工与使用：CDA数据分析师的核 ...

【CDA干货】AARRR用户增长漏斗模型全解析：从理论到 ...

【CDA干货】随机森林特征重要性分析全解析：从原理 ...

CDA数据分析师：精通表格结构数据核心功能，解锁高 ...

【CDA干货】一文读懂Excel箱线图含义：用简单图表解 ...

CDA教育闭环

常见问题

关于我们

CDA数据分析师公众号

CDA考试中心小程序

CDA数据分析师App下载