京公网安备 11010802034615号
经营许可证编号:京B2-20210330
R语言中的数组和列表
R语言中的数组与其它语言数组类似,它是一种高维的数据结构。维数过高运算会很不方便,所以用的很少,这里介绍是本着不落下任何知识点的目的。万一以后遇到了,虽然不方便,还是可以进行运算的。当然了,矩阵是二维数组,是数组的一种特殊形式。R中的列表是一种特殊的数组,每个元素又可以是一个列表可以含有多个元素,里面可以包含各种数据类型,故功能非常强大。
数组
数组有一个维数向量,可以定义数组的维数,通过array()进行创建数组如下:
> arr <- array(c(1:24),dim = c(2,3,4))
> dim(arr)
[1] 2 3 4
> arr
, , 1
[,1] [,2] [,3]
[1,] 1 3 5
[2,] 2 4 6
, , 2
[,1] [,2] [,3]
[1,] 7 9 11
[2,] 8 10 12
, , 3
[,1] [,2] [,3]
[1,] 13 15 17
[2,] 14 16 18
, , 4
[,1] [,2] [,3]
[1,] 19 21 23
[2,] 20 22 24
> class(arr)
[1] "array"
以上创建语句,第一个参数表示用1:24作为数组的数据,dim = c(2,3,4)表示数组维数为2x3x4。
我们也可以用下面这种方式定义数组:
> arr1 <- c(1:24)
> dim(arr1) <- c(2,3,4)
> arr1
, , 1
[,1] [,2] [,3]
[1,] 1 3 5
[2,] 2 4 6
, , 2
[,1] [,2] [,3]
[1,] 7 9 11
[2,] 8 10 12
, , 3
[,1] [,2] [,3]
[1,] 13 15 17
[2,] 14 16 18
, , 4
[,1] [,2] [,3]
[1,] 19 21 23
[2,] 20 22 24
> class(arr1)
[1] "array"
这种方式就是先指定向量c(1:24)为数组的数据,再指定其维数为2x3x4,最后其类型仍然为"array"。
矩阵的取块,其实与上节讲的矩阵取值一样。比如:
> arr[1,,]
[,1] [,2] [,3] [,4]
[1,] 1 7 13 19
[2,] 3 9 15 21
[3,] 5 11 17 23
我们可以将数组转化为矩阵,比如我们尝试将arr这个数组转化为矩阵:
a <- as.matrix(arr)
猜测一下,a会长什么样?我们看一下,哈哈!
> a
[,1]
[1,] 1
[2,] 2
[3,] 3
[4,] 4
[5,] 5
[6,] 6
[7,] 7
[8,] 8
[9,] 9
[10,] 10
[11,] 11
[12,] 12
[13,] 13
[14,] 14
[15,] 15
[16,] 16
[17,] 17
[18,] 18
[19,] 19
[20,] 20
[21,] 21
[22,] 22
[23,] 23
[24,] 24
> dim(a)
[1] 24 1
竟然是一个24x1的矩阵,没想到吧。
列表
R中用list()创建列表,比如
> li <- list(c(1:3),c('a','b'),c(4:6))
> li
[[1]]
[1] 1 2 3
[[2]]
[1] "a" "b"
[[3]]
[1] 4 5 6
这个列表包含三个元素,分别是c(1:3),c('a','b'),c(4:6),而每个元素又是一个数据集合,我现在要取第一个元素的第三个元素(就是3)
> li[[1]][1]
[1] 1
取第一个元素,就是
> li[1]
[[1]]
[1] 1 2 3
列表的每个元素还是列表,同样说明列表可以嵌套。具体定位到最里层元素就是相应数据类型了:
> class(li[[1]][1])
[1] "integer"
> li[[2]][1]
[1] "a"
> class(li[[2]][1])
[1] "character"
我们可以给列表每个元素取一个名字
> names(li) <- c('a1','a2','a3')
> li
$a1
[1] 1 2 3
$a2
[1] "a" "b"
$a3
[1] 4 5 6
为什么取名字呢,这样我们引用时可以直接利用美元符号“$”+名字‘a1’,’a2‘,‘a3’,而不需要写[[1]]那么麻烦了。
> li$a1
[1] 1 2 3
> li$a2[1]
[1] "a"
其实,给列表起名字还有更方便之处,这才是最终目的:可以在绑定数据后,直接引用列表元素名即可。
绑定列表用attach()
> attach(li)
然后,就可以直接引用列表元素名了。
> a1
[1] 1 2 3
> a2[2]
[1] "b"
关于R语言中的数组和列表(主要是列表)用法很灵活多样,在以后我们会有实战应用会用到。这次,大家把今天介绍的好好练习就好!
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据工作的全流程中,数据清洗是最基础、最耗时,同时也是最关键的核心环节,无论后续是做常规数据分析、可视化报表,还是开展 ...
2026-03-20在大数据与数据驱动决策的当下,“数据分析”与“数据挖掘”是高频出现的两个核心概念,也是很多职场人、入门学习者容易混淆的术 ...
2026-03-20在CDA(Certified Data Analyst)数据分析师的全流程工作闭环中,统计制图是连接严谨统计分析与高效业务沟通的关键纽带,更是CDA ...
2026-03-20在MySQL数据库优化中,分区表是处理海量数据的核心手段——通过将大表按分区键(如时间、地域、ID范围)分割为多个独立的小分区 ...
2026-03-19在商业智能与数据可视化领域,同比、环比增长率是分析数据变化趋势的核心指标——同比(YoY)聚焦“长期趋势”,通过当前周期与 ...
2026-03-19在数据分析与建模领域,流传着一句行业共识:“数据决定上限,特征决定下限”。对CDA(Certified Data Analyst)数据分析师而言 ...
2026-03-19机器学习算法工程的核心价值,在于将理论算法转化为可落地、可复用、高可靠的工程化解决方案,解决实际业务中的痛点问题。不同于 ...
2026-03-18在动态系统状态估计与目标跟踪领域,高精度、高鲁棒性的状态感知是机器人导航、自动驾驶、工业控制、目标检测等场景的核心需求。 ...
2026-03-18“垃圾数据进,垃圾结果出”,这是数据分析领域的黄金法则,更是CDA(Certified Data Analyst)数据分析师日常工作中时刻恪守的 ...
2026-03-18在机器学习建模中,决策树模型因其结构直观、易于理解、无需复杂数据预处理等优势,成为分类与回归任务的首选工具之一。而变量重 ...
2026-03-17在数据分析中,卡方检验是一类基于卡方分布的假设检验方法,核心用于分析分类变量之间的关联关系或实际观测分布与理论期望分布的 ...
2026-03-17在数字化转型的浪潮中,企业积累的数据日益庞大且分散——用户数据散落在注册系统、APP日志、客服记录中,订单数据分散在交易平 ...
2026-03-17在数字化时代,数据分析已成为企业决策、业务优化、增长突破的核心支撑,从数据仓库搭建(如维度表与事实表的设计)、数据采集清 ...
2026-03-16在数据仓库建设、数据分析(尤其是用户行为分析、业务指标分析)的实践中,维度表与事实表是两大核心组件,二者相互依存、缺一不 ...
2026-03-16数据是CDA(Certified Data Analyst)数据分析师开展一切工作的核心载体,而数据读取作为数据生命周期的关键环节,是连接原始数 ...
2026-03-16在用户行为分析实践中,很多从业者会陷入一个核心误区:过度关注“当前数据的分析结果”,却忽视了结果的“泛化能力”——即分析 ...
2026-03-13在数字经济时代,用户的每一次点击、浏览、停留、转化,都在传递着真实的需求信号。用户行为分析,本质上是通过收集、整理、挖掘 ...
2026-03-13在金融、零售、互联网等数据密集型行业,量化策略已成为企业挖掘商业价值、提升决策效率、控制经营风险的核心工具。而CDA(Certi ...
2026-03-13在机器学习建模体系中,随机森林作为集成学习的经典算法,凭借高精度、抗过拟合、适配多场景、可解释性强的核心优势,成为分类、 ...
2026-03-12在机器学习建模过程中,“哪些特征对预测结果影响最大?”“如何筛选核心特征、剔除冗余信息?”是从业者最常面临的核心问题。随 ...
2026-03-12