R语言添加缺失行

kqhtkvqz 于 2023-09-27 发布在其他

关注(0)|答案(4)|浏览(126)

我的excel数据文件的格式是：

day                 value
 01-01-2000 00:00:00    4
 01-01-2000 00:01:00    3
 01-01-2000 00:02:00    1
 01-01-2000 00:04:00    1

我打开我的文件，用这个：

ts = read.csv(file=pathfile, header=TRUE, sep=",")

如何将列“值”中的数字为零的附加行添加到数据框中。输出示例：

day                  value
 01-01-2000 00:00:00    4
 01-01-2000 00:01:00    3
 01-01-2000 00:02:00    1
 01-01-2000 00:03:00    0
 01-01-2000 00:04:00    1

来源：https://stackoverflow.com/questions/16742725/adding-missing-rows

4条答案

按热度按时间

dxxyhpgq1#

现在，这在padr包中完全自动化。只需要一行代码。

original <- data.frame(
  day = as.POSIXct(c("01-01-2000 00:00:00",
                     "01-01-2000 00:01:00",
                     "01-01-2000 00:02:00",
                     "01-01-2000 00:04:00"), format="%m-%d-%Y %H:%M:%S"),
  value = c(4, 3, 1, 1))

library(padr)
library(dplyr) # for the pipe operator
original %>% pad %>% fill_by_value(value)

请参阅vignette("padr")或this博客文章了解其工作原理。

赞(0）回复(0）举报 2023-09-27

btxsgosb2#

我认为这是一个更通用的解决方案，它依赖于创建一个所有时间戳的序列，将其用作新 Dataframe 的基础，然后在适用的情况下在df中填写原始值。

# convert original `day` to POSIX
ts$day <- as.POSIXct(ts$day, format="%m-%d-%Y %H:%M:%S", tz="GMT")

# generate a sequence of all minutes in a day
minAsNumeric <- 946684860 + seq(0,60*60*24,by=60) # all minutes of your first day
minAsPOSIX <- as.POSIXct(minAsNumeric, origin="1970-01-01", tz="GMT") # convert those minutes to POSIX

# build complete dataframe
newdata <- as.data.frame(minAsPOSIX)
newdata$value <- ts$value[pmatch(newdata$minAsPOSIX, ts$day)] # fill in original `value`s where present
newdata$value[is.na(newdata$value)] <- 0 # replace NAs with 0

赞(0）回复(0）举报 2023-09-27

ukxgm1gy3#

试试看：

ts = read.csv(file=pathfile, header=TRUE, sep=",", stringsAsFactors=F)
ts.tmp = rbind(ts,list("01-01-2000 00:03:00",0))
ts.out = ts.tmp[order(ts.tmp$day),]

请注意，您需要强制加载第一列中的字符串作为字符而不是因子，否则您将遇到rbind问题。要使day列成为因子，请执行以下操作：

ts.out$day = as.factor(ts.out$day)

赞(0）回复(0）举报 2023-09-27

i7uaboj44#

Tidyr提供了一个很好的complete函数来为隐式缺失的数据生成行。可以使用fill参数将NA转换为0。

library(tidyr)

ts |>
  complete(day=seq.POSIXt(min(day), max(day), by="min"), fill = list(value = 0))

请注意，我将日期的粒度设置为分钟，因为数据集需要每分钟一行。

赞(0）回复(0）举报 2023-09-27

我来回答

R语言添加缺失行

4条答案

相关问题

热门标签

最新问答

R语言 添加缺失行

4条答案

相关问题

热门标签

最新问答

R语言添加缺失行