我正在使用survey package
分析几个调查问题。由于感兴趣的问题只在某些数据收集期间被问及,因此我只需要整个数据集的一个子集。有趣的是,以下两种方法产生了略有不同的结果:
- #1:为整个数据集构建一个调查设计对象,使用感兴趣的时段作为分组变量对其进行更新,然后对定义的时段运行分析。
- #2:仅选择感兴趣时段的观测,为此子集构建调查设计对象,然后对其运行分析。
例如,当执行基于设计的Wilcoxon检验时,t-statistic
和p-value
在两种方法中略有不同。为什么?哪一个更“正确”?
非常感谢!
1条答案
按热度按时间wpcxdonn1#
这个问题在CrossValidated here上得到了回答(正如评论所说,在场外here上有更多细节)
如果这些方法给予了不同的答案,您需要#1