- bounty将在5小时后过期**。回答此问题可获得+50声望奖励。rudgus51998希望引起更多人关注此问题。
我将glmmTMB和pscl中的zeroinfl应用于同一个数据集,得到了条件部分相同的系数,但二进制部分的系数有些不同,您知道造成差异的潜在因素吗?
谢谢!
下面是zeroinfl的结果:
# > summary(pscl.res)
#
# Call:
# zeroinfl(formula = outside_treatment ~ group + baseline.risk + Age.group +
# offset(log(Follow.up)) | group, data = final, dist = "negbin",
# link = "logit", trace = TRUE)
#
# Pearson residuals:
# Min 1Q Median 3Q Max
# -1.0332 -0.7003 -0.4041 0.1675 12.5728
# Count model coefficients (negbin with log link):
# Estimate Std. Error z value Pr(>|z|)
# (Intercept) -2.39168 0.13282 -18.007 < 2e-16 ***
# group1 -0.22475 0.09833 -2.286 0.0223 *
# baseline.risk2 -0.20385 0.12947 -1.575 0.1154
# baseline.risk3 -0.67367 0.12422 -5.423 5.85e-08 ***
# Age.group1 -0.65774 0.11554 -5.693 1.25e-08 ***
# Log(theta) 0.12366 0.07302 1.693 0.0904 .
# Zero-inflation model coefficients (binomial with logit link):
# Estimate Std. Error z value Pr(>|z|)
# (Intercept) -16.564 389.991 -0.042 0.966
# group1 -2.743 1909.909 -0.001 0.999
# ---
# Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
#
# Theta = 1.1316
# Number of iterations in BFGS optimization: 35
# Log-likelihood: -1531 on 8 Df
这是glmmTBM的结果:
# > summary(true.zinb)
# Family: nbinom2 ( log )
# Formula:
# outside_treatment ~ group + baseline.risk + Age.group + offset(log(Follow.up))
# Zero inflation: ~1 + group
# Data: final
#
# AIC BIC logLik deviance df.resid
# 3078.1 3110.5 -1531.1 3062.1 414
#
#
# Dispersion parameter for nbinom2 family (): 1.13
#
# Conditional model:
# Estimate Std. Error z value Pr(>|z|)
# (Intercept) -2.39168 0.13282 -18.007 < 2e-16 ***
# group1 -0.22475 0.09833 -2.286 0.0223 *
# baseline.risk2 -0.20385 0.12947 -1.575 0.1154
# baseline.risk3 -0.67367 0.12422 -5.423 5.85e-08 ***
# Age.group1 -0.65774 0.11554 -5.693 1.25e-08 ***
# ---
# Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
#
# Zero-inflation model:
# Estimate Std. Error z value Pr(>|z|)
# (Intercept) -20.8282 3289.0961 -0.006 0.995
# group1 0.4139 4626.1083 0.000 1.000
1条答案
按热度按时间ryevplcw1#
tl;dr零通货膨胀概率的估计值实际上为零。在此限制下,这些差异由数值近似值差异驱动(在预测概率的尺度上非常小)。如果在没有零通货膨胀的情况下重新拟合模型,则可能会得到几乎相同的模型拟合(即,非常相似的对数似然和预测值)。
参考条件下的零膨胀分量(假定为
group0
)极小,实际上为零;真实的最大似然估计大概是-Inf
,但是-16或-20(取决于包)是似然表面变得足够平坦从而优化器断定它已经找到最优的地方。(plogis(-16)
对应于1 e-7的z-i概率,plogis(-20)
对应于2 e-9)。group1
估计是与group0
值的偏差,但得到的对数尺度估计值约为-18,你还会注意到这些估计值的标准差都很大,这表明 *Wald近似 * 已经失效。如果在
glmmTMB
模型上运行diagnose()
,它将标记这些大效应并给予简要解释,大致如下zi(零通货膨胀的对数比值)、离差或随机效应(对数标准差)中较大的负系数表明不必要的成分(在约束尺度上收敛为零)...