京公网安备 11010802034615号
经营许可证编号:京B2-20210330
R语言中的数组和列表
R语言中的数组与其它语言数组类似,它是一种高维的数据结构。维数过高运算会很不方便,所以用的很少,这里介绍是本着不落下任何知识点的目的。万一以后遇到了,虽然不方便,还是可以进行运算的。当然了,矩阵是二维数组,是数组的一种特殊形式。R中的列表是一种特殊的数组,每个元素又可以是一个列表可以含有多个元素,里面可以包含各种数据类型,故功能非常强大。
数组
数组有一个维数向量,可以定义数组的维数,通过array()进行创建数组如下:
> arr <- array(c(1:24),dim = c(2,3,4))
> dim(arr)
[1] 2 3 4
> arr
, , 1
[,1] [,2] [,3]
[1,] 1 3 5
[2,] 2 4 6
, , 2
[,1] [,2] [,3]
[1,] 7 9 11
[2,] 8 10 12
, , 3
[,1] [,2] [,3]
[1,] 13 15 17
[2,] 14 16 18
, , 4
[,1] [,2] [,3]
[1,] 19 21 23
[2,] 20 22 24
> class(arr)
[1] "array"
以上创建语句,第一个参数表示用1:24作为数组的数据,dim = c(2,3,4)表示数组维数为2x3x4。
我们也可以用下面这种方式定义数组:
> arr1 <- c(1:24)
> dim(arr1) <- c(2,3,4)
> arr1
, , 1
[,1] [,2] [,3]
[1,] 1 3 5
[2,] 2 4 6
, , 2
[,1] [,2] [,3]
[1,] 7 9 11
[2,] 8 10 12
, , 3
[,1] [,2] [,3]
[1,] 13 15 17
[2,] 14 16 18
, , 4
[,1] [,2] [,3]
[1,] 19 21 23
[2,] 20 22 24
> class(arr1)
[1] "array"
这种方式就是先指定向量c(1:24)为数组的数据,再指定其维数为2x3x4,最后其类型仍然为"array"。
矩阵的取块,其实与上节讲的矩阵取值一样。比如:
> arr[1,,]
[,1] [,2] [,3] [,4]
[1,] 1 7 13 19
[2,] 3 9 15 21
[3,] 5 11 17 23
我们可以将数组转化为矩阵,比如我们尝试将arr这个数组转化为矩阵:
a <- as.matrix(arr)
猜测一下,a会长什么样?我们看一下,哈哈!
> a
[,1]
[1,] 1
[2,] 2
[3,] 3
[4,] 4
[5,] 5
[6,] 6
[7,] 7
[8,] 8
[9,] 9
[10,] 10
[11,] 11
[12,] 12
[13,] 13
[14,] 14
[15,] 15
[16,] 16
[17,] 17
[18,] 18
[19,] 19
[20,] 20
[21,] 21
[22,] 22
[23,] 23
[24,] 24
> dim(a)
[1] 24 1
竟然是一个24x1的矩阵,没想到吧。
列表
R中用list()创建列表,比如
> li <- list(c(1:3),c('a','b'),c(4:6))
> li
[[1]]
[1] 1 2 3
[[2]]
[1] "a" "b"
[[3]]
[1] 4 5 6
这个列表包含三个元素,分别是c(1:3),c('a','b'),c(4:6),而每个元素又是一个数据集合,我现在要取第一个元素的第三个元素(就是3)
> li[[1]][1]
[1] 1
取第一个元素,就是
> li[1]
[[1]]
[1] 1 2 3
列表的每个元素还是列表,同样说明列表可以嵌套。具体定位到最里层元素就是相应数据类型了:
> class(li[[1]][1])
[1] "integer"
> li[[2]][1]
[1] "a"
> class(li[[2]][1])
[1] "character"
我们可以给列表每个元素取一个名字
> names(li) <- c('a1','a2','a3')
> li
$a1
[1] 1 2 3
$a2
[1] "a" "b"
$a3
[1] 4 5 6
为什么取名字呢,这样我们引用时可以直接利用美元符号“$”+名字‘a1’,’a2‘,‘a3’,而不需要写[[1]]那么麻烦了。
> li$a1
[1] 1 2 3
> li$a2[1]
[1] "a"
其实,给列表起名字还有更方便之处,这才是最终目的:可以在绑定数据后,直接引用列表元素名即可。
绑定列表用attach()
> attach(li)
然后,就可以直接引用列表元素名了。
> a1
[1] 1 2 3
> a2[2]
[1] "b"
关于R语言中的数组和列表(主要是列表)用法很灵活多样,在以后我们会有实战应用会用到。这次,大家把今天介绍的好好练习就好!
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在使用Excel数据透视表进行数据分析时,我们常需要在透视表旁添加备注列,用于标注数据背景、异常说明、业务解读等关键信息。但 ...
2025-12-22在MySQL数据库的性能优化体系中,索引是提升查询效率的“核心武器”——一个合理的索引能将百万级数据的查询耗时从秒级压缩至毫 ...
2025-12-22在数据量爆炸式增长的数字化时代,企业数据呈现“来源杂、格式多、价值不均”的特点,不少CDA(Certified Data Analyst)数据分 ...
2025-12-22在企业数据化运营体系中,同比、环比分析是洞察业务趋势、评估运营效果的核心手段。同比(与上年同期对比)可消除季节性波动影响 ...
2025-12-19在数字化时代,用户已成为企业竞争的核心资产,而“理解用户”则是激活这一资产的关键。用户行为分析系统(User Behavior Analys ...
2025-12-19在数字化转型的深水区,企业对数据价值的挖掘不再局限于零散的分析项目,而是转向“体系化运营”——数据治理体系作为保障数据全 ...
2025-12-19在数据科学的工具箱中,析因分析(Factor Analysis, FA)、聚类分析(Clustering Analysis)与主成分分析(Principal Component ...
2025-12-18自2017年《Attention Is All You Need》一文问世以来,Transformer模型凭借自注意力机制的强大建模能力,在NLP、CV、语音等领域 ...
2025-12-18在CDA(Certified Data Analyst)数据分析师的时间序列分析工作中,常面临这样的困惑:某电商平台月度销售额增长20%,但增长是来 ...
2025-12-18在机器学习实践中,“超小数据集”(通常指样本量从几十到几百,远小于模型参数规模)是绕不开的场景——医疗领域的罕见病数据、 ...
2025-12-17数据仓库作为企业决策分析的“数据中枢”,其价值完全依赖于数据质量——若输入的是缺失、重复、不一致的“脏数据”,后续的建模 ...
2025-12-17在CDA(Certified Data Analyst)数据分析师的日常工作中,“随时间变化的数据”无处不在——零售企业的每日销售额、互联网平台 ...
2025-12-17在休闲游戏的运营体系中,次日留存率是当之无愧的“生死线”——它不仅是衡量产品核心吸引力的首个关键指标,更直接决定了后续LT ...
2025-12-16在数字化转型浪潮中,“以用户为中心”已成为企业的核心经营理念,而用户画像则是企业洞察用户、精准决策的“核心工具”。然而, ...
2025-12-16在零售行业从“流量争夺”转向“价值深耕”的演进中,塔吉特百货(Target)以两场标志性实践树立了行业标杆——2000年后的孕妇精 ...
2025-12-15在统计学领域,二项分布与卡方检验是两个高频出现的概念,二者都常用于处理离散数据,因此常被初学者混淆。但本质上,二项分布是 ...
2025-12-15在CDA(Certified Data Analyst)数据分析师的工作链路中,“标签加工”是连接原始数据与业务应用的关键环节。企业积累的用户行 ...
2025-12-15在Python开发中,HTTP请求是与外部服务交互的核心场景——调用第三方API、对接微服务、爬取数据等都离不开它。虽然requests库已 ...
2025-12-12在数据驱动决策中,“数据波动大不大”是高频问题——零售店长关心日销售额是否稳定,工厂管理者关注产品尺寸偏差是否可控,基金 ...
2025-12-12在CDA(Certified Data Analyst)数据分析师的能力矩阵中,数据查询语言(SQL)是贯穿工作全流程的“核心工具”。无论是从数据库 ...
2025-12-12