将for循环替换为dplyr across / rowwise?

7gyucuyw  于 2022-12-30  发布在  其他
关注(0)|答案(1)|浏览(160)

我很难把for循环重构成dplyr管道。我需要引用 Dataframe a和之前计算过的行。有什么建议吗?
非常感谢!

a <- tibble::tribble(~ 'a',  ~ 'b',  ~ 'c',
                     .1, .2, .3,
                     .2, .4, .6,
                     .3, .6, .9)
b <- a

for (i in 2:nrow(a)) {
  b[i, ] <- b[i - 1, ] + b[i, ] * (1 - b[i - 1, ])
}

c <- a |>
  dplyr::mutate(dplyr::across(where(is.numeric),
                              ~ dplyr::lag(.x, 1, 0) +
                                .x *
                                (1 - dplyr::lag(.x, 1, 0))))

d <- a |> dplyr::rowwise( )|>
  dplyr::mutate(dplyr::across(where(is.numeric),
                              ~ dplyr::lag(.x, 1, 0) +
                                .x *
                                (1 - dplyr::lag(.x, 1, 0))))
identical(b,c)
identical(b,d)
m2xkgtsf

m2xkgtsf1#

您可以使用Reduce()(如果愿意,也可以使用purrr::accumulate())。

library(dplyr)

a |>
  mutate(across(where(is.numeric), \(v) Reduce(\(x, y) x + y * (1 - x) , v, accumulate = TRUE)))

# A tibble: 3 × 3
      a     b     c
  <dbl> <dbl> <dbl>
1 0.1   0.2   0.3  
2 0.28  0.52  0.72 
3 0.496 0.808 0.972

相关问题