基于附加列R中的值的子集列

2ic8powd 于 2023-10-13 发布在其他

关注(0)|答案(3)|浏览(130)

我有一个DF：

df1 <- data.frame(ID = c('a', 'b', 'c', 'c1', 'd', 'e', 'f', 'g', 'h', 'h1'),
                  T_10_12 = c(11, 15, 14, 14, 13, 16, 15, 12, 11, 12),
                  T_12_14 = c(12, 16, 16, 16, 14, 17, 16.5, 13, 12, 12),
                  T_14_16 = c(13, 18, 17.5, 16.5, 15, 18, 17.2, 13, 13, 14),
                  T_out = c(10.5, 12.3, 14.5, 15.1, 15, 13, 12, 13, 13, 14))

我希望对列'T_10_12'、'T_12_14'、'T_14_16'进行子集化，以便每行只取一个值。从中选择值的列由列“T_out”中的数字指定。如果'T_out'= 10.5，则来自T_10_12的值被分配给新变量'T_in'。如果“T_out”= 14.5，则“T_14_16”中的值被分配给“T_in”。输出应该如下所示：

ID T_in T_out
1   a 11.0  10.5
2   b 16.0  12.3
3   c 17.5  14.5
4  c1 16.5  15.1
5   d 15.0  15.0
6   e 17.0  13.0
7   f 15.0  12.0
8   g 16.5  13.0
9   h 13.0  13.0
10 h1 14.0  14.0

来源：https://stackoverflow.com/questions/77212091/subset-columns-based-on-value-in-additional-column-r

3条答案

按热度按时间

q5iwbnjs1#

我们可以使用case_when：

library(dplyr)
df1 %>%
  mutate(T_in = case_when(
    T_out == 10.5 ~ T_10_12,
    T_out >= 10.5 & T_out < 12.5 ~ T_10_12,
    T_out >= 12.5 & T_out < 14.5 ~ T_12_14,
    .default = T_14_16
  )) %>%
  select(ID, T_in, T_out)

ID T_in T_out
1   a 11.0  10.5
2   b 15.0  12.3
3   c 17.5  14.5
4  c1 16.5  15.1
5   d 15.0  15.0
6   e 17.0  13.0
7   f 15.0  12.0
8   g 13.0  13.0
9   h 12.0  13.0
10 h1 12.0  14.0

展开查看全部

赞(0）回复(0）举报 2023-10-13

7fhtutme2#

使用findInterval的基本R选项（因为您可以在列名中使用12和14来对T_out中的值的区间进行分类）

transform(
    df1,
    T_in = df1[-1][cbind(
        seq_along(T_out),
        findInterval(T_out, c(12, 14)) + 1
    )]
)[c("ID", "T_in", "T_out")]

给

ID T_in T_out
1   a 11.0  10.5
2   b 16.0  12.3
3   c 17.5  14.5
4  c1 16.5  15.1
5   d 15.0  15.0
6   e 17.0  13.0
7   f 16.5  12.0
8   g 13.0  13.0
9   h 12.0  13.0
10 h1 14.0  14.0

展开查看全部

赞(0）回复(0）举报 2023-10-13

js5cn81o3#

根据cur_column中的值检查条件的通用方法

library(dplyr)
library(stringr)
df %>% 
  reframe(
    ID, 
    T_in = rowSums(across(matches("T_\\d+"), ~ 
      if_else(as.numeric(str_extract(cur_column(), "T_(\\d+)", 1)) < T_out & 
              as.numeric(str_extract(cur_column(), "(\\d+)$", 1) >= T_out), .x, 0))), 
    T_out)

输出

ID T_in T_out
1   a 11.0  10.5
2   b 16.0  12.3
3   c 17.5  14.5
4  c1 16.5  15.1
5   d 15.0  15.0
6   e 17.0  13.0
7   f 15.0  12.0
8   g 13.0  13.0
9   h 12.0  13.0
10 h1 12.0  14.0

展开查看全部

赞(0）回复(0）举报 2023-10-13

我来回答

基于附加列R中的值的子集列

3条答案

相关问题

热门标签

最新问答