这是一个非常基本的问题,可能更多的是关于数据争论而不是编码,对不起。
我有一个数据集,其中1520名参与者每周测量一次,持续12周。然而,存在大量缺失值,并且不同的参与者提供了不同数量的数据,以及来自不同周的数据(例如,一些人具有来自所有1 - 2周的数据,一些人仅具有来自第1-3周的数据,一些人仅具有来自第4-8周的数据,一些人具有来自第1-2周和第5-7周的数据但不具有来自第3-4周的数据,等等)。
我可以很容易地计算出有多少参与者有1,2,3等。观察,以及我从第1周、第2周等有多少观察。但是,我想知道我的数据覆盖范围是什么不同的一周范围(例如。第1-5周、第2-6周、第3-9周的观察次数是多少)。此外,在我收到此数据之前,每个参与者缺失的“周行”已被删除(见下文)。我使用R(我有一种感觉,这是我应该能够从频率表中做的事情,但我不能用我的大脑来处理它)。
5名参与者和10周的重复试验:
id<-rep(1:5, each=10)
week<-rep(1:10, times=5)
outcome<-rnorm(50) #outcome is probably not needed for the example, but I put it in for
#completeness
ind <- which(week %in% sample(week, 15))
week[ind]<-NA
exdata<-data.frame(id, week, outcome)
exdata2<-subset(exdata, exdata$week != "NA")
有人能建议一个程序,我可以找出不同的“周范围”的数据覆盖量从这样的数据?提前感谢!
1条答案
按热度按时间jjjwad0x1#
定义一个函数可能会有所帮助,因为您没有指定需要计算多少个范围。
希望这对你有帮助:)