京公网安备 11010802034615号
经营许可证编号:京B2-20210330
R实现类似EXCEL中数据的透视功能:数据的行列转换
先介绍下融合和重铸能实现什么样的功能:
例子:想把表1—->>转换成为表2
表1:
表2:
R实现数据的透视功能,使用reshape2包中的melt()函数和dcast()函数。在《R语言实战》这本书中有着详细的介绍。我在这里引用了其中的一些内容。
首先是融合函数,融合顾名思义就是把原先的数据进行融化合并,具体melt()函数会融合成什么样的形式呢?
Library(reshape2)
Md=melt(mydata,id=c(“ID”,”Time”)
其中的参数id是用来唯一的确定观察值的,就行是sql中的主键一样。
其余没有纳入id的特征/属性都会被R默认为归为variable这个新生成的特征/属性中。最后一列就是对应的value。
这就是melt函数把原先的数据表融合后的形式。
把数据融合好之后,就可以进行数据的重铸了。重铸的函数式dcast()函数,d的含义在这里是dataframe的含义。
重铸成什么样式呢?
Newdata=dcast(md,formulate,fun.aggregate,fill=value)
其中formulate的形式如下:
Rowvar1+rowvr2+….=colvar1+colvar2+colvar3+…;公式的左边变量从melt中划出来用来作为重铸表的行变量,右边是确定重铸表的列变量,未在公式中的变量是当做值变量了。
Fun.aggrate函数是可选的数据整合函数,作用在重铸表的数值上面。
Fill=value ;其中fill参数是用来指定重铸后的表中缺失值使用什么数值来代替。
上面的例子的直接使用重铸就可以实现:
library(reshape2)
data <- read.csv(file = ” “,stringsAsFactors = F)
newdata <-dcast(data,用户~手机品牌)
在这里介绍一下管道函数我感觉是非常好用的在R中。因为管道函数的出现使得R中避免生成过多的变量,节省内存不说还能使得代码显得很简洁且容易理解。第二是能够避免使用过多的括号,生成复杂的函数套函数的形式。
%>%
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
【核心关键词】软件、洞察力、大数据、产品、经验、硬件、流量、创新、决策、数据安全、网络安全、数据分析、决策制定、数据挖 ...
2026-06-18在方案选型、效果复盘、产品评估、供应商筛选等各类业务决策场景中,仅凭单一指标下结论往往会陷入 “以偏概全” 的误区。多维度 ...
2026-06-18 很多数据分析师精通Excel单元格操作,但当被问到“表结构数据的基本处理单位是什么”“字段和记录的本质区别”“为什么表结 ...
2026-06-18在数据分析、用户运营与业务增长的工作体系中,漏斗拆解是最基础也最高频的问题定位方法。很多业务场景下,我们只能看到最终的转 ...
2026-06-17在数据库开发、数据清洗与报表统计场景中,数值类型转换为日期是高频刚需操作。业务系统常以 Unix 时间戳、整型日期(如20240617 ...
2026-06-17 数据分析师八成以上的时间在和数据表格打交道,但许多人拿到Excel后习惯性地先算、先分析,结果回头发现漏了一列关键数据, ...
2026-06-17【核心关键词】数据库、电商、知识、产品、数据产品、监管业务、产品经理、业务系统、用户行为分析、用户分析、数据分析、电商 ...
2026-06-16在 Python 动态类型与面向对象的编程体系中,变量定义与类实例化是构建代码逻辑的两大核心基石。变量是数据存储、传递与运算的基 ...
2026-06-16 很多数据分析师每天与Excel打交道,但当被问到“表格结构数据和表结构数据有什么区别”“数据类型误判会引发哪些分析错误” ...
2026-06-16在 MySQL 查询性能优化体系中,索引是降低查询耗时、提升数据库吞吐的核心手段。其中联合索引与覆盖索引是实际开发中最高频的两 ...
2026-06-15在数据仓库建设与商业智能分析体系中,维度建模是应用最广泛的建模方法论,而事实表与维度表是维度建模的两大核心构件,共同构成 ...
2026-06-15 很多数据分析师能熟练计算指标,但当被问到“这家企业的核心业务目标是什么”“如何把模糊的战略目标拆解为可量化的指标”“ ...
2026-06-15在数据分析、业务监控、运营复盘等场景中,列值趋势计算是核心需求之一。无论是分析销售额的月度增长、用户活跃的变化趋势、库存 ...
2026-06-12在数字经济深度渗透的当下,消费者的购买行为已从过去的 “被动接受” 转变为 “主动决策”。流量红利消退、获客成本攀升、用户 ...
2026-06-12CDA三级认证是三个级别中的塔尖,全面考察数据战略、团队领导和复杂项目的综合能力。它所对应的《敏捷数据挖掘》教材,不再局限 ...
2026-06-12在游戏产业的商业逻辑中,付费玩家是支撑游戏生存与发展的核心支柱。行业普遍遵循 “二八定律”:20% 的付费玩家贡献了游戏 80% ...
2026-06-11【核心关键词】企业、定位、传统、产品、互联网、可视化、业务侧、数字化、结构化、数据分析、传统制造业、市场状态、发展空间 ...
2026-06-11 解读《CDA二级教材:量化策略分析(2025)》的全景结构与学习逻辑 ” CDA二级认证是企业招聘数据分析师时最常提及的证书门槛 ...
2026-06-11【核心关键词】药企、可视化、营销、分类、数据分析师、销售数据、业务人员、指导方向、分析报告、营销数据、营销医生 【专访摘 ...
2026-06-10在统计学分析、问卷调研、实验验证、业务复盘等场景中,卡方检验与 T 检验是应用最广泛的两类基础假设检验方法。前者专门处理分 ...
2026-06-10