R语言在负二项混合模型中分配特定组的分散参数

5vf7fwbs 于 2023-09-27 发布在其他

关注(0)|答案(1)|浏览(91)

我有（过度分散的）计数数据，这些数据是在不同的设施收集的，我想使用负二项随机效应模型进行建模，其中设施具有随机效应。在进一步检查数据时，每个设施的过度分散变化很大（即，一些设施中的结果分布近似于泊松分布，其他设施高度过度分散，一些介于两者之间），即：

我想指定模型中每个组的离差。我尝试使用GLMMadaptive::mixed_model，因为它有参数n_phis和initial_values，文档指定允许您输入多少个参数及其初始值，所以我通过MASS:fitdistr估计了色散参数（szs）并尝试将其插入：

szs <- sapply(unique(dta$facility), \(i) MASS::fitdistr(dta$outcome[dta$facility == i], "negative binomial")[[1]][1])

GLMMadaptive::mixed_model(fixed = outcome ~ phase,
                          random = ~ 1|facility,
                          data = dta,
                          n_phis = length(unique(dta$facility)),
                          initial_values = szs, # also tried initial_values = c(phis = szs) given the function documentation
                          family = GLMMadaptive::negative.binomial())

然而，这是不成功的，因为它仍然使用单个分散参数建模（删除n_phis和initial_values命令返回完全相同的模型）。我在lme4::glmer.nb中没有看到这种类型的任何选项。
经过一些搜索，我看到这可以通过brms包中的贝叶斯方法来完成（交叉验证问题在这里和here），但是可以使用使用其他方法的包（即GLMMadaptive::mixed_model，lme4::glmer.nb或其他包）来完成吗？需要说明的是，我的问题是关于编码实现，而不是底层的统计概念。
数据

set.seed(123)
n <- 100
dta <- data.frame(facility = rep(LETTERS[1:4], each = n),
                  phase = rep(c("Intervention", "Control"), each = n / 2),
                  outcome = c(rnbinom(n, mu = 5, size = 0.02), 
                              rpois(n, lambda = 5),
                              rpois(n, lambda = 8), 
                              rnbinom(n, mu = 8, size = 0.5)))

r

来源：https://stackoverflow.com/questions/77159420/assigning-group-specific-dispersion-parameters-in-a-negative-binomial-mixed-mode

1条答案

按热度按时间

qcuzuvrc1#

您完全可以在glmmTMB中使用dispformula实现这一点（请参阅下面的代码和结果）。

mixed_model()中的n_phis参数并不像你想象的那样：这描述了特定族的色散和形状参数所需的参数的数量（例如，0代表泊松，1代表阴性二进制，2代表特威迪）
这个模型有点奇怪它对组的平均值（位置）使用随机效应，但对组的离散度/尺度使用固定效应（目前glmmTMB不允许离散度模型中的随机效应，例如：dispformula = ~ 1|facility)，即使有时这可能是有意义的...）
根据链接的CV问题中的注解，这也应该可以通过VGAM::negbinomial()...

library(glmmTMB)
m <- glmmTMB(outcome ~ phase + (1|facility),
             dispformula  = ~ facility,
             data = dta,
             family = nbinom2)

Formula:          outcome ~ phase + (1 | facility)
Dispersion:               ~facility
Data: dta
      AIC       BIC    logLik  df.resid 
1684.8276 1712.7678 -835.4138       393 
Random-effects (co)variances:

Conditional model:
 Groups   Name        Std.Dev.
 facility (Intercept) 0.2193  

Number of obs: 400 / Conditional model: facility, 4

Fixed Effects:

Conditional model:
      (Intercept)  phaseIntervention  
          1.89473           -0.01547  

Dispersion model:
(Intercept)    facilityB    facilityC    facilityD  
     -4.279        9.191       10.154        3.657

赞(0）回复(0）举报 2023-09-27

我来回答

R语言在负二项混合模型中分配特定组的分散参数

1条答案

相关问题

热门标签

最新问答

R语言 在负二项混合模型中分配特定组的分散参数

1条答案

相关问题

热门标签

最新问答

R语言在负二项混合模型中分配特定组的分散参数