R语言如何在单变量分析中有效地循环变量？

ohfgkhjo 于 2023-10-13 发布在其他

关注(0)|答案(1)|浏览(124)

我写了下面的代码来运行考克斯回归，并将它们输出到一个表中。我想对多个变量进行单变量运算。你能帮我用一个循环使它更快吗？变量有Grade，DCIS，LVE，Tsize等等...
我写的代码如下：

CoxphToDF <- function(y) {
    stopifnot(class(y) == "summary.coxph")
    cbind(y[["coefficients"]], 
          `lower 0.95` = y[["conf.int"]][, "lower .95"], 
          `upper 0.95` = y[["conf.int"]][, "upper .95"])
          }

Grade <- data[!is.na(data$Grade) & data$Grade != "", ]
df1 = CoxphToDF(summary(coxph(Surv(OS, OS.Event) ~ Grade, data = Grade)))

DCIS <- data[!is.na(data$DCIS) & data$DCIS != "", ]
df2 = CoxphToDF(summary(coxph(Surv(OS, OS.Event) ~ DCIS, data = DCIS)))

LVE <- data[!is.na(data$LVE) & data$LVE != "", ]
df3 = CoxphToDF(summary(coxph(Surv(OS, OS.Event) ~ LVE, data = LVE)))

Tsize <- data[!is.na(data$Tsize) & data$Tsize != "", ]
df4 = CoxphToDF(summary(coxph(Surv(OS, OS.Event) ~ Tsize, data = Tsize)))

write.table(rbind(df1,df2,df3,df4), "univariate_results.txt", sep="\t", col.names = NA)

我尝试了以下方法：

#vector of variables
variables_to_test <- c("Grade", "DCIS", "LVE", "Tsize")

#list to store the results
results_list <- list()

# Iterate
for (variable in variables_to_test) {
  subset_data <- data[!is.na(data[[variable]]) & data[[variable]] != "", ]
  result <- CoxphToDF(summary(coxph(Surv(OS, OS.Event) ~ ., data = subset_data)))
  results_list[[variable]] <- result
}

# single data frame
results_df <- do.call(rbind, results_list)

它给了我意想不到的结果与所有的变量，但没有选定的和奇怪的结果
我的输入数据是：

dput(data)

structure(list(ID = c(1393L, 1105L, 1347L, 1390L, 1398L, 1508L, 
1043L, 1361L, 1304L, 1101L, 1135L, 1148L, 1171L, 993L, 1147L, 
1509L, 1522L, 1523L, 1301L, 1396L, 1113L, 1121L, 1161L, 1323L, 
1351L, 1385L, 1504L, 1544L, 1564L, 1165L, 1146L, 1108L, 1354L, 
1369L, 1563L, 1330L, 1378L, 1397L, 1338L, 1511L, 1130L, 1137L, 
1187L, 1052L, 1059L, 1087L, 1087L, 1303L, 1328L, 1334L), OS = c(65L, 
88L, 69L, 65L, 64L, 63L, 94L, 67L, 74L, 90L, 83L, 81L, 78L, 47L, 
81L, 63L, 62L, 62L, 75L, 25L, 86L, 84L, 79L, 72L, 69L, 65L, 64L, 
60L, 61L, 78L, 81L, 87L, 68L, 66L, 59L, 71L, 66L, 64L, 71L, 63L, 
84L, 83L, 83L, 93L, 91L, 84L, 84L, 74L, 72L, 33L), OS.Event = c(0L, 
0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 1L, 0L, 0L, 0L, 
0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 1L, 0L, 0L, 0L, 
0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 
1L), Grade = c(2L, 3L, 2L, NA, 3L, 3L, 1L, 3L, 2L, 3L, 2L, 3L, 
2L, 3L, 2L, 3L, 3L, 2L, NA, 3L, NA, 2L, 2L, 2L, 1L, 2L, 3L, 2L, 
2L, 2L, 3L, 3L, 2L, 3L, 3L, 2L, 2L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 
2L, 2L, 2L, NA, 3L, 3L), DCIS = c("NO", "Present", "NO", "Present", 
"Present", "Present", "Present", "NO", "Present", "Present", 
"Present", "Present", "Present", "Present", "Present", "Present", 
"NO", "Present", "NO", "NO", "Present", "Present", "NO", "NO", 
"Present", "Present", "NO", "Present", "Present", "Present", 
"NO", "Present", "Present", "Present", "NO", "Present", "NO", 
"NO", "Present", "NO", "NO", "NO", "NO", "NO", "Present", "NO", 
"NO", "Present", "Present", "NO"), LVE = c("NO", "YES", "NO", 
"NO", "YES", "YES", "NO", "NO", "YES", "NO", "NO", "NO", "YES", 
"", "NO", "NO", "NO", "YES", "NO", "NO", "NO", "NO", "NO", "NO", 
"NO", "NO", "NO", "NO", "NO", "YES", "NO", "NO", "NO", "NO", 
"NO", "YES", "YES", "NO", "NO", "NO", "NO", "NO", "NO", "YES", 
"YES", "NO", "NO", "NO", "NO", "NO"), Tsize = c("<=3", " >3cm", 
"<=3", "<=3", "<=3", "<=3", "<=3", "<=3", "<=3", " >3cm", "<=3", 
"<=3", " >3cm", " >3cm", "<=3", "<=3", "<=3", "<=3", " >3cm", 
"<=3", "<=3", "<=3", " >3cm", "<=3", " >3cm", "<=3", "<=3", "<=3", 
"<=3", "<=3", "<=3", "<=3", "<=3", " >3cm", "<=3", " >3cm", "<=3", 
"<=3", " >3cm", "<=3", "<=3", " >3cm", " >3cm", " >3cm", "<=3", 
" >3cm", " >3cm", "<=3", "<=3", "<=3"), LN = c("Negative", "Positive", 
"Negative", "Negative", "Negative", "Positive", "Negative", "Negative", 
"Positive", "Positive", "Negative", "Positive", "Positive", "Positive", 
"Positive", "Positive", "Positive", "Negative", "Positive", "Positive", 
"Negative", "Negative", "Negative", "Negative", "Negative", "Negative", 
"Positive", "Negative", "Positive", "Positive", "Positive", "Negative", 
"Negative", "Positive", "Negative", "Positive", "Negative", "Negative", 
"Positive", "Negative", "Negative", "Negative", "Negative", "Positive", 
"Negative", "Positive", "Positive", "Negative", "Negative", "Positive"
)), class = "data.frame", row.names = c(NA, -50L))

r

来源：https://stackoverflow.com/questions/77277755/how-to-effectively-loop-variables-in-univariate-analysis

1条答案

按热度按时间

d5vmydt91#

你在找lapply()吗？

#vector of variables
variables_to_test <- c("Grade", "DCIS", "LVE", "Tsize")

do.call(what = "rbind", 
        args = lapply(X = variables_to_test, 
                      FUN = \(x) {
                        data <- data[!is.na(data[[x]]) 
                                     & data[[x]] != "", ]
                        CoxphToDF(summary(coxph(Surv(OS, OS.Event) ~ ., data = data)))
                      }
                      )
        )

请注意，每个模型拟合都会发出警告

1: In coxph.fit(X, Y, istrat, offset, init, control, weights = weights,  :
  Ran out of iterations and did not converge

我认为do.call(what = "rbind", args = something)没有任何优势。考虑将结果存储在列表中，即list_of_sth <- lapply(...。

赞(0）回复(0）举报 2023-10-13

我来回答

R语言如何在单变量分析中有效地循环变量？

1条答案

相关问题

热门标签

最新问答

R语言 如何在单变量分析中有效地循环变量？

1条答案

相关问题

热门标签

最新问答

R语言如何在单变量分析中有效地循环变量？