R语言 glmmTMB和归零f之间的结果差异(pscl)

mspsb9vt  于 2023-03-05  发布在  其他
关注(0)|答案(1)|浏览(223)
    • bounty将在5小时后过期**。回答此问题可获得+50声望奖励。rudgus51998希望引起更多人关注此问题。

我将glmmTMB和pscl中的zeroinfl应用于同一个数据集,得到了条件部分相同的系数,但二进制部分的系数有些不同,您知道造成差异的潜在因素吗?
谢谢!
下面是zeroinfl的结果:

# > summary(pscl.res)
# 
# Call:
#   zeroinfl(formula = outside_treatment ~ group + baseline.risk + Age.group + 
#              offset(log(Follow.up)) | group, data = final, dist = "negbin", 
#            link = "logit", trace = TRUE)
# 
# Pearson residuals:
#     Min      1Q  Median      3Q     Max 
# -1.0332 -0.7003 -0.4041  0.1675 12.5728 

# Count model coefficients (negbin with log link):
#                Estimate Std. Error z value Pr(>|z|)    
# (Intercept)    -2.39168    0.13282 -18.007  < 2e-16 ***
# group1         -0.22475    0.09833  -2.286   0.0223 *  
# baseline.risk2 -0.20385    0.12947  -1.575   0.1154    
# baseline.risk3 -0.67367    0.12422  -5.423 5.85e-08 ***
# Age.group1     -0.65774    0.11554  -5.693 1.25e-08 ***
# Log(theta)      0.12366    0.07302   1.693   0.0904 .

# Zero-inflation model coefficients (binomial with logit link):
#             Estimate Std. Error z value Pr(>|z|)
# (Intercept)  -16.564    389.991  -0.042    0.966
# group1        -2.743   1909.909  -0.001    0.999
# ---
# Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 
# 
# Theta = 1.1316 
# Number of iterations in BFGS optimization: 35 
# Log-likelihood: -1531 on 8 Df

这是glmmTBM的结果:

# > summary(true.zinb)
# Family: nbinom2  ( log )
# Formula:          
# outside_treatment ~ group + baseline.risk + Age.group + offset(log(Follow.up))
# Zero inflation:                     ~1 + group
# Data: final
# 
# AIC      BIC   logLik deviance df.resid 
# 3078.1   3110.5  -1531.1   3062.1      414 
# 
# 
# Dispersion parameter for nbinom2 family (): 1.13 
# 
# Conditional model:
#                Estimate Std. Error z value Pr(>|z|)    
# (Intercept)    -2.39168    0.13282 -18.007  < 2e-16 ***
# group1         -0.22475    0.09833  -2.286   0.0223 *  
# baseline.risk2 -0.20385    0.12947  -1.575   0.1154    
# baseline.risk3 -0.67367    0.12422  -5.423 5.85e-08 ***
# Age.group1     -0.65774    0.11554  -5.693 1.25e-08 ***
#   ---
# Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
# 
# Zero-inflation model:
#              Estimate Std. Error z value Pr(>|z|)
# (Intercept)  -20.8282  3289.0961  -0.006    0.995
# group1         0.4139  4626.1083   0.000    1.000
ryevplcw

ryevplcw1#

tl;dr零通货膨胀概率的估计值实际上为零。在此限制下,这些差异由数值近似值差异驱动(在预测概率的尺度上非常小)。如果在没有零通货膨胀的情况下重新拟合模型,则可能会得到几乎相同的模型拟合(即,非常相似的对数似然和预测值)。

参考条件下的零膨胀分量(假定为group0)极小,实际上为零;真实的最大似然估计大概是-Inf,但是-16或-20(取决于包)是似然表面变得足够平坦从而优化器断定它已经找到最优的地方。(plogis(-16)对应于1 e-7的z-i概率,plogis(-20)对应于2 e-9)。group1估计是与group0值的偏差,但得到的对数尺度估计值约为-18,你还会注意到这些估计值的标准差都很大,这表明 *Wald近似 * 已经失效。
如果在glmmTMB模型上运行diagnose(),它将标记这些大效应并给予简要解释,大致如下
zi(零通货膨胀的对数比值)、离差或随机效应(对数标准差)中较大的负系数表明不必要的成分(在约束尺度上收敛为零)...

相关问题