啊啊啊啊啊吖

2018-11-26   阅读量: 737

数据分析师 数据挖掘 R语言

主成份分析计算步骤

扫码加入数据分析学习群

1) 设原始变量X1, X2, …XP的n次观测数据矩阵为:

2) 将数据矩阵按列进行中心标准化。 为了方便, 将标准化后的数据矩

阵仍然记为X。

3) 求相关系数矩阵R, R=(rijp×p, rij的定义为:

4) 求R的特征方程det(R-λE) =0的特征根λ1≥λ2≥…λp≥0。

5) 确定主成分个数 , α根据实际问题确定, 一般取80%。

6) 计算m个相应的单位特征向量:

7) 计算主成分:

##设置工作空间

#把“数据及程序” 文件夹复制到F盘下, 再用setwd设置工作空间

setwd("F: /数据及程序chapter4/示例程序")

#数据读取

inputfile=read.csv('./data/principal_component.csv', he=F)

#主成分分析PCA=princomp(inputfile, cor=F)

names(PCA) #查看输出项(PCA$sdev) ^2 #主成分特征根

summary(PCA) #主成分贡献率PCA$loadings #主成分载荷PCA$scores #主成分得分

添加CDA认证专家【维克多阿涛】,微信号:【cdashijiazhuang】,提供数据分析指导及CDA考试秘籍。已助千人通过CDA数字化人才认证。欢迎交流,共同成长!
0.0000 0 3 关注作者 收藏

评论(0)


暂无数据

推荐课程

推荐帖子