啊啊啊啊啊吖

2019-03-15   阅读量: 598

数据分析师 R语言

使用dplyr case_when根据另一列的值更改NA值

structure(list(a = c(NA, 3, 4, NA, 3, "Council" , "Council", 1), b = c("Council A", 3, 4,

"Council B", 6, 7, 2, 6), c = c(6, 3, 6, 5, 3, 6, 5, 3), d = c(6, 2, 4,

5, 3, 7, 2, 6), e = c(1, 2, 4, 5, 6, 7, 6, 3), f = c(2, 3, 4,

2, 2, 7, 5, 2)), .Names = c("a", "b", "c", "d", "e", "f"), row.names = c(NA,

8L), class = "data.frame")

我试图a使用dplyr mutuate和case_when基于文本转换对象b。a如果b在字符串中包含Council,我想将值转换为Council 。

我使用的代码是 DF %>% select(a, b) %>% mutate(a =case_when(grepl("Council", b) ~"Council"))

但是NA,如果它们不包含字符串Council,则所有值都会变为a。我已经审查了其他帖子并尝试了各种方法,包括ifelse。我想保持相同的数据帧只是将任何NA值转换为理事会,但仅限于它是NA值的情况。

解决办法:从 ?case_when

如果没有匹配的情况,则返回NA。

因此,对于没有“理事会”字样的情况,b它会返回NA。

您需要定义TRUE参数case_when并将其分配给a不保持条件不变时保持值不变。

library(dplyr)

df %>%

mutate(a = case_when(grepl("Council", b) ~"Council",

TRUE ~ a))

# a b c d e f

#1 Council Council A 6 6 1 2

#2 3 3 3 2 2 3

#3 4 4 6 4 4 4

#4 Council Council B 5 5 5 2

#5 3 6 3 3 6 2

#6 Council 7 6 7 7 7

#7 Council 2 5 2 6 5

#8 1 6 3 6 3 2

在这种情况下,您还可以使用基数R来实现结果

df$a[grepl("Council", df$b)] <- "Council"

15.5086 1 1 关注作者 收藏

评论(0)


暂无数据

推荐课程

推荐帖子