R语言 glmmTMB和归零f之间的结果差异(pscl)

mspsb9vt  于 2023-03-05  发布在  其他
关注(0)|答案(1)|浏览(245)
    • bounty将在5小时后过期**。回答此问题可获得+50声望奖励。rudgus51998希望引起更多人关注此问题。

我将glmmTMB和pscl中的zeroinfl应用于同一个数据集,得到了条件部分相同的系数,但二进制部分的系数有些不同,您知道造成差异的潜在因素吗?
谢谢!
下面是zeroinfl的结果:

  1. # > summary(pscl.res)
  2. #
  3. # Call:
  4. # zeroinfl(formula = outside_treatment ~ group + baseline.risk + Age.group +
  5. # offset(log(Follow.up)) | group, data = final, dist = "negbin",
  6. # link = "logit", trace = TRUE)
  7. #
  8. # Pearson residuals:
  9. # Min 1Q Median 3Q Max
  10. # -1.0332 -0.7003 -0.4041 0.1675 12.5728
  11. # Count model coefficients (negbin with log link):
  12. # Estimate Std. Error z value Pr(>|z|)
  13. # (Intercept) -2.39168 0.13282 -18.007 < 2e-16 ***
  14. # group1 -0.22475 0.09833 -2.286 0.0223 *
  15. # baseline.risk2 -0.20385 0.12947 -1.575 0.1154
  16. # baseline.risk3 -0.67367 0.12422 -5.423 5.85e-08 ***
  17. # Age.group1 -0.65774 0.11554 -5.693 1.25e-08 ***
  18. # Log(theta) 0.12366 0.07302 1.693 0.0904 .
  19. # Zero-inflation model coefficients (binomial with logit link):
  20. # Estimate Std. Error z value Pr(>|z|)
  21. # (Intercept) -16.564 389.991 -0.042 0.966
  22. # group1 -2.743 1909.909 -0.001 0.999
  23. # ---
  24. # Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
  25. #
  26. # Theta = 1.1316
  27. # Number of iterations in BFGS optimization: 35
  28. # Log-likelihood: -1531 on 8 Df

这是glmmTBM的结果:

  1. # > summary(true.zinb)
  2. # Family: nbinom2 ( log )
  3. # Formula:
  4. # outside_treatment ~ group + baseline.risk + Age.group + offset(log(Follow.up))
  5. # Zero inflation: ~1 + group
  6. # Data: final
  7. #
  8. # AIC BIC logLik deviance df.resid
  9. # 3078.1 3110.5 -1531.1 3062.1 414
  10. #
  11. #
  12. # Dispersion parameter for nbinom2 family (): 1.13
  13. #
  14. # Conditional model:
  15. # Estimate Std. Error z value Pr(>|z|)
  16. # (Intercept) -2.39168 0.13282 -18.007 < 2e-16 ***
  17. # group1 -0.22475 0.09833 -2.286 0.0223 *
  18. # baseline.risk2 -0.20385 0.12947 -1.575 0.1154
  19. # baseline.risk3 -0.67367 0.12422 -5.423 5.85e-08 ***
  20. # Age.group1 -0.65774 0.11554 -5.693 1.25e-08 ***
  21. # ---
  22. # Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
  23. #
  24. # Zero-inflation model:
  25. # Estimate Std. Error z value Pr(>|z|)
  26. # (Intercept) -20.8282 3289.0961 -0.006 0.995
  27. # group1 0.4139 4626.1083 0.000 1.000
ryevplcw

ryevplcw1#

tl;dr零通货膨胀概率的估计值实际上为零。在此限制下,这些差异由数值近似值差异驱动(在预测概率的尺度上非常小)。如果在没有零通货膨胀的情况下重新拟合模型,则可能会得到几乎相同的模型拟合(即,非常相似的对数似然和预测值)。

参考条件下的零膨胀分量(假定为group0)极小,实际上为零;真实的最大似然估计大概是-Inf,但是-16或-20(取决于包)是似然表面变得足够平坦从而优化器断定它已经找到最优的地方。(plogis(-16)对应于1 e-7的z-i概率,plogis(-20)对应于2 e-9)。group1估计是与group0值的偏差,但得到的对数尺度估计值约为-18,你还会注意到这些估计值的标准差都很大,这表明 *Wald近似 * 已经失效。
如果在glmmTMB模型上运行diagnose(),它将标记这些大效应并给予简要解释,大致如下
zi(零通货膨胀的对数比值)、离差或随机效应(对数标准差)中较大的负系数表明不必要的成分(在约束尺度上收敛为零)...

相关问题