R语言我们可以按组计算所有列的趋势吗？

mpbci0fu 于 2023-01-10 发布在其他

关注(0)|答案(2)|浏览(182)

我有一个如下所示的数据框。我想计算所有数值列的趋势，以及它们是否显著或不每个名称。

library(EnvStats)
  dat=structure(list(date = c("1983-12-01", "1984-01-01", 
  "1984-02-01", 
                    "1984-03-01", "1984-04-01", "1984-05-01"), 
  rig = c(68.1, 62.4, 
                                                                       
   67.5, 78.9, 81.7, 72.2), pass = c(9.57, 10.49, 11.97, 
  11.43, 9.54, 
                                                                                                         
  8.98), name = structure(c(1L, 2L, 3L, 4L, 5L, 6L), levels = 
  c("az",  "az", "nc", "nc", "et", "et"), class = "factor")), 
  row.names = c(NA, 6L), class = "data.frame")

在R中有没有一个函数可以做到这一点？我们可以用途：

kendallTrendTest(rig ~ date)

但是我应该怎样做才能让所有列都有这样的输出呢？

name    rig_trend_slope   rig_trend_pvalue pass_trend_slope   pass_trend_pvalue
  az
  nc
  et

来源：https://stackoverflow.com/questions/75047220/can-we-compute-trend-for-all-columns-by-group

2条答案

按热度按时间

ikfrs5lh1#

正如@Quiten提到的，数据中的观察数量是有限的，所以分组方法会返回错误。如果我们想对多列执行此操作，请对summarise中的列执行across循环，从list输出中提取所需的组件作为tibble，然后使用unnest_wider创建宽数据集

library(dplyr)
library(tidyr)
library(EnvStats)
library(tibble)
library(flextable)
library(officer)
dat1 <- dat %>%
  mutate(date2 = as.numeric(as.Date(date))) %>%
  # group_by(name) %>%
  # or use reframe in the devel version
  summarise(across(rig:pass, ~ 
                     {tmp <- kendallTrendTest(reformulate('date2', 
     response = cur_column()))
                     tibble(trend_slope = tmp$estimate['slope'],
                            trend_pvalue = tmp$p.value)})) %>%
  unnest_wider(where(is_tibble), names_sep = "_") %>%
  flextable %>%
  colformat_double(i=1,digit=2 )
for(nm in dat1$col_keys)
  {dat1 <- dat1 %>%
  color(i= as.formula(sprintf("~%s<0", nm)), j=nm, color="red")
  }

输出

要保存为word格式，我们可以使用officer包中的save_as_docx

tf <- tempfile(fileext = ".docx")
save_as_docx(
  dat1, path = tf
)

输出

注：此处group_by(name)被注解，因为只有2个观察值，并且在所有情况下都返回错误。对于完整数据集，取消注解group_by（名称）
broom::tidy似乎与kendallTrendTest中的类存在问题

赞(0）回复(0）举报 2023-01-10

y1aodyip2#

首先，每组只有两个值，这是不理想的。要计算每组的趋势，可以使用dplyr、group_by和do执行测试。还要确保kendallTrendTest中的x变量是数值。可以使用tidy获得一些系数。下面是一个可重现的示例：

library(dplyr)
library(EnvStats)
library(broom)

models <- dat %>% 
  mutate(date2 = as.numeric(as.Date(date))) %>%
  group_by(name) %>% 
  do(model = kendallTrendTest(rig ~ date2, data = .))

models %>% 
  broom::tidy(model)

赞(0）回复(0）举报 2023-01-10

我来回答

R语言我们可以按组计算所有列的趋势吗？

2条答案

相关问题

热门标签

最新问答

R语言 我们可以按组计算所有列的趋势吗？

2条答案

相关问题

热门标签

最新问答

R语言我们可以按组计算所有列的趋势吗？