R Dataframe 中的条件重命名值

velaa5lx 于 2023-05-04 发布在其他

关注(0)|答案(3)|浏览(267)

我有一个简单的dataframe，其中有一个6位数的大列，格式为R：

library(dplyr)

df <- data.frame(number = c(111110, 111211, 111311, 111411, 111110, 111311, 930920, 039203, 940291, 111110), 
                 value = seq(1,10,1)
                 )

输出

df
#   number value
#1  111110     1
#2  111211     2
#3  111311     3
#4  111411     4
#5  111110     5
#6  111311     6
#7  930920     7
#8   39203     8
#9  940291     9
#10 111110    10

我想用“ID”重命名这些数字，但我遇到的问题是数据集中有重复的数字。

预期输出

df
#   number  ID  value
#1  111110  ID-1   1
#2  111211  ID-2   2
#3  111311  ID-3   3
#4  111411  ID-4   4
#5  111110  ID-1   5
#6  111311  ID-3   6
#7  930920  ID-5   7
#8   39203  ID-6   8
#9  940291  ID-7   9
#10 111110  ID-1   10

问题

如何在数据框架中创建额外的列，为每个唯一的数字提供自己的ID？我认为dplyr包和mutate函数可能是一个选项？

来源：https://stackoverflow.com/questions/76130092/conditional-rename-values-in-r-dataframe

3条答案

按热度按时间

wqnecbli1#

从number列创建factor，然后将其转换为整数。从factor到integer的转换将为您提供因子水平的索引：

df <- data.frame(number = c(111110, 111211, 111311, 111411, 111110, 111311, 930920, 039203, 940291, 111110), 
    value = seq(1,10,1)
)

df <- df %>% mutate(ID=paste0("ID-", as.integer(factor(number))))

这给出：

df

   number value   ID
1  111110     1 ID-2
2  111211     2 ID-3
3  111311     3 ID-4
4  111411     4 ID-5
5  111110     5 ID-2
6  111311     6 ID-4
7  930920     7 ID-6
8   39203     8 ID-1
9  940291     9 ID-7
10 111110    10 ID-2

如果要保留ID列中的原始顺序，请指定因子的水平：

df <- df %>% mutate(ID=paste0("ID-", as.integer(factor(number, levels=unique(number)))))

赞(0）回复(0）举报 2023-05-04

jchrr9hc2#

可以使用match：

library(dplyr)
df %>% 
  mutate(id = paste0("ID-", match(number, unique(number))))

   number value   id
1  111110     1 ID-1
2  111211     2 ID-2
3  111311     3 ID-3
4  111411     4 ID-4
5  111110     5 ID-1
6  111311     6 ID-3
7  930920     7 ID-5
8   39203     8 ID-6
9  940291     9 ID-7
10 111110    10 ID-1

赞(0）回复(0）举报 2023-05-04

6psbrbz93#

使用cur_group_id

library(dplyr)
df %>%
   mutate(id = sprintf('ID-%d', cur_group_id()), .by = number)

输出

number value   id
1  111110     1 ID-1
2  111211     2 ID-2
3  111311     3 ID-3
4  111411     4 ID-4
5  111110     5 ID-1
6  111311     6 ID-3
7  930920     7 ID-5
8   39203     8 ID-6
9  940291     9 ID-7
10 111110    10 ID-1

赞(0）回复(0）举报 2023-05-04

我来回答

R Dataframe 中的条件重命名值

3条答案

相关问题

热门标签

最新问答