我使用R中的iris
数据集作为下面的示例。
library(lme4)
mixed.fit.b <- lmer(Sepal.Width ~ Sepal.Length + (1+ Sepal.Length|Species), data = iris)
summary(mixed.fit.b)
ranef(mixed.fit.b)$Species
coef(mixed.fit.b)$Species
predict(mixed.fit.b)
随机截距和斜率如下所示。
(Intercept) Sepal.Length
setosa -0.49549054 0.78331501
versicolor 1.19197858 0.26689317
virginica 1.17260303 0.27282273
这意味着截距为-0.49549054(固定截距+随机截距),斜率为0.78331501(固定+随机斜率),对吧?所以,有三对截距和斜率,在一般的线性模型中,我们可以说y =截距+斜率,y每改变x一个斜率,但在混合模型中,有三对截距和斜率。2如何报告它们?
1条答案
按热度按时间ygya80vv1#
建议
我同意Roland的观点,即使用三个集群的混合模型是不可取的(见Gelman & Hill,2007,链接如下)谈到你的主要问题,我们想知道有多少随机变异被模型区分开,事实上,这真的应该被用作首先使用模型的理由(参见Meteyard & Davies,2020,他们建议拟合仅随机效应模型作为完整模型的前身)。
考虑到这一点,我建议您报告模型的以下部分,以考虑随机效应(包括您提到的)。虽然这些部分并非都是必要的,但它们肯定提供了信息:
工作示例:拟合模型
我将继续使用您现有的数据作为示例,但我会将其更改为收敛的数据,因为您的第一个模型是单一的,在报告时无法使用。我已经加载了所用函数所需的四个库,并适合模型。
总结随机效应方差
接下来,我们可以总结一下模型,但是我更喜欢使用
broom.mixed
包中的tidy
函数来快速获得RE估计值。如下所示:
根据这些信息,我们现在知道:
上面引用的一篇文章的The appendix显示了如何报告此信息,如果我没有记错的话,这是您的主要问题。
卡特彼勒随机效应图
如有必要,我们可以在文章中报告这一信息,但也可以使用毛毛虫图绘制这些效应:
这也是Roland提醒您随机效应聚类数量较多的部分原因。您在此处只看到三个截距和斜率,无法捕捉到您希望从混合模型中获得的大量变异。然而,我们可以在此处获得两个关键见解:
1.维吉尼亚植物的平均花瓣长度(随机截距)比其他物种高得多。
1.杂色植物的花瓣宽度比其他植物有更高的斜率项。
其他随机效应估计值
我们还可以使用以下代码获得ICC和伪R2估计值:
如下所示:
本总结中需要注意的事项:
引文
下面是我之前提到的引文。Gelman & Hill是学习混合模型的权威来源。Meteyard & Davies的文章是运行混合模型的最佳实践指南。如果你觉得这个答案有帮助,请告诉我。