行号(_N) | 患者ID | 开始日期 | 开始_窗口 |
---|---|---|---|
1 | 零零一 | 2023-04-01 2023-04-01 | 2023-04-01 2023-04-01 |
二 | 零零一 | 2023-04-03 2023-04-03 | 不适用 |
三 | 零零一 | 2023-04-05 2023-04-05 2023-04-05 | 不适用 |
四 | 零零一 | 2023-04-06 2023-04-06 | 不适用 |
五 | 零零一 | 2023-04-08 2023-04-08 | 不适用 |
六 | 零零一 | 2023-04-09 2023-04-09 | 2023-04-09 2023-04-09 |
七 | 零零一 | 2023-04-11 2023-04-11 2023-04-11 | 2023-04-11 2023-04-11 2023-04-11 |
八 | 零零一 | 2023-04-13 2023-04-13 2023-04-13 | 不适用 |
九 | 零零一 | 2023-04-16 2023-04-16 2023-04-16 | 不适用 |
10个 | 零零一 | 2023-04-18 2023-04-18 2023-04-18 | 2023-04-18 2023-04-18 2023-04-18 |
十一 | 零零二 | 2023-04-02 2023-04-02 | 2023-04-02 2023-04-02 |
十二岁 | 零零二 | 2023-04-04 2023-04-04 | 2023-04-04 2023-04-04 |
十三 | 零零二 | 2023-04-07 2023-04-07 | 2023-04-07 2023-04-07 |
十四岁 | 零零二 | 2023-04-08 2023-04-08 | 2023-04-08 2023-04-08 |
十五岁 | 零零二 | 2023-04-10 2023-04-10 2023-04-10 | 不适用 |
# Create the data frame
df <- data.frame(
Row_Num = c(1:15),
Patient_ID = c(rep(001, 10), rep(002, 5)),
Start_Date = c("2023-04-01", "2023-04-03", "2023-04-05", "2023-04-06", "2023-04-08",
"2023-04-09", "2023-04-11", "2023-04-13", "2023-04-16", "2023-04-18",
"2023-04-02", "2023-04-04", "2023-04-07", "2023-04-08", "2023-04-10"),
Start_Window = c("2023-04-01", NA, NA, NA, NA, "2023-04-09", "2023-04-11", NA, NA, "2023-04-18",
"2023-04-02", "2023-04-04", "2023-04-07", "2023-04-08", NA)
)
# Print the table
print(df)
我有上面的表,它是使用上面的可复制的R代码创建的。
我想用“开始日期”的值替换开始窗口中的“NA”。然而,当NA值对于每个患者ID是连续的时,我想要向后携带第一个值。
所以在这个例子中,在第1-5行中,start_window应该是“2023-04-08”。第8-9行start_window应为“2023-04-16”。第15行应为“2023-04-10”。
1条答案
按热度按时间798qvoo81#
您可以基于
Patient_ID
和Start_Window
的游程长度创建分组ID,对于NA
s,则采用该组的最后一个Start_Date
值。