我使用mgcv来拟合具有随机效应的GAMs,例如:
gam_fit <- gam(y ~ s(age) + s(region, bs='re'),
data = my_data,
method = 'REML')
参见Gavin Simpson's excellent post about using random effects in GAMs with mgcv。
两个问题:
1.如何提取随机效应的估计值?我在一个单独的包中找到了extract_ranef(),但也许mgcv
有自己的方法?
1.在plot(gam_fit)
中,在effects
与Gaussian quantiles
图中绘制了什么?如何使用这些图?
1条答案
按热度按时间qhhrdooz1#
如何提取随机效应的估计值?我在一个单独的包中找到了extract_ranef(),但也许mgcv有自己的方法?
您可以使用
coef(gam_fit)
,但这也将包括s(age)
的样条基的系数。为了只恢复这些,我将用途:在plot(gam_fit)中,效应与高斯分位数图中绘制的是什么?如何使用这些图?
在 x 轴上,它显示了高斯分位数;这些反映了标准正态分布变量的值。在 y 轴上,其显示随机截距的预测值。对于混合效应模型,假设这些数据服从正态分布。因此,点与直线的任何偏差指示与正态分布的预期偏差。如果 x 轴最左侧的点低于直线,则表明某些预测的随机截距的值低于正态分布的预期值。如果 x 轴最右侧的点低于直线,则表明某些预测的随机截距值高于正态分布的预期值。如果你同时观察到这两条曲线(或者同时观察到这两条曲线分别位于直线的上方和下方),这表明尾部的峰度或厚度与正态分布不同。我认为这种偏差只会在很小的程度上影响推断和预测的准确性。