R语言 如何在混合效应模型中报告随机效应

afdcj2ne  于 2023-01-28  发布在  其他
关注(0)|答案(1)|浏览(223)

我使用R中的iris数据集作为下面的示例。

library(lme4)
mixed.fit.b <- lmer(Sepal.Width ~ Sepal.Length + (1+ Sepal.Length|Species), data = iris)
summary(mixed.fit.b)

ranef(mixed.fit.b)$Species
coef(mixed.fit.b)$Species
predict(mixed.fit.b)

随机截距和斜率如下所示。

(Intercept) Sepal.Length
setosa     -0.49549054   0.78331501
versicolor  1.19197858   0.26689317
virginica   1.17260303   0.27282273

这意味着截距为-0.49549054(固定截距+随机截距),斜率为0.78331501(固定+随机斜率),对吧?所以,有三对截距和斜率,在一般的线性模型中,我们可以说y =截距+斜率,y每改变x一个斜率,但在混合模型中,有三对截距和斜率。2如何报告它们?

ygya80vv

ygya80vv1#

建议

我同意Roland的观点,即使用三个集群的混合模型是不可取的(见Gelman & Hill,2007,链接如下)谈到你的主要问题,我们想知道有多少随机变异被模型区分开,事实上,这真的应该被用作首先使用模型的理由(参见Meteyard & Davies,2020,他们建议拟合仅随机效应模型作为完整模型的前身)。
考虑到这一点,我建议您报告模型的以下部分,以考虑随机效应(包括您提到的)。虽然这些部分并非都是必要的,但它们肯定提供了信息:

  • 随机截距/随机斜率的SD
  • 任何随机效应的相关性(如可能,解释原因)
  • 模型的ICC(这将说明发生了多少聚类)
  • 伪R2,尝试解释固定效应可以解释多少效应,固定效应和随机效应可以解释多少效应。
  • 随机效应的卡特彼勒图。
工作示例:拟合模型

我将继续使用您现有的数据作为示例,但我会将其更改为收敛的数据,因为您的第一个模型是单一的,在报告时无法使用。我已经加载了所用函数所需的四个库,并适合模型。

#### Load Libraries ####
library(lmerTest)
library(lattice)
library(broom.mixed)
library(performance)

#### Fit Model ####
fit <- lmer(Petal.Length
                    ~ Petal.Width
                    + (1 + Petal.Width |Species), 
                    data = iris)
总结随机效应方差

接下来,我们可以总结一下模型,但是我更喜欢使用broom.mixed包中的tidy函数来快速获得RE估计值。

##### Summarise Model ####
tidy(fit)

如下所示:

# A tibble: 6 × 8
  effect   group    term                      estim…¹ std.e…² stati…³    df p.value
  <chr>    <chr>    <chr>                       <dbl>   <dbl>   <dbl> <dbl>   <dbl>
1 fixed    NA       (Intercept)                 2.43    0.898    2.71  1.97   0.115
2 fixed    NA       Petal.Width                 1.10    0.414    2.65  2.00   0.118
3 ran_pars Species  sd__(Intercept)             1.52   NA       NA    NA     NA    
4 ran_pars Species  cor__(Intercept).Petal.W…  -0.408  NA       NA    NA     NA    
5 ran_pars Species  sd__Petal.Width             0.646  NA       NA    NA     NA    
6 ran_pars Residual sd__Observation             0.362  NA       NA    NA     NA    
# … with abbreviated variable names ¹​estimate, ²​std.error, ³​statistic

根据这些信息,我们现在知道:

  • 在控制固定和随机效应后,物种的条件平均花瓣长度变化约1.52SD。
  • 不同物种的斜率变化较小(.646 SD),表明花瓣宽度和花瓣长度之间的关系在不同物种之间变化不大。
  • 花瓣宽度和花瓣长度之间的相关性约为-. 41,表明随着平均花瓣长度的增加,斜率通常会降低。

上面引用的一篇文章的The appendix显示了如何报告此信息,如果我没有记错的话,这是您的主要问题。

卡特彼勒随机效应图

如有必要,我们可以在文章中报告这一信息,但也可以使用毛毛虫图绘制这些效应:

#### Plot Dotplot of Random Effects ####
dotplot(ranef(fit))

这也是Roland提醒您随机效应聚类数量较多的部分原因。您在此处只看到三个截距和斜率,无法捕捉到您希望从混合模型中获得的大量变异。然而,我们可以在此处获得两个关键见解:
1.维吉尼亚植物的平均花瓣长度(随机截距)比其他物种高得多。
1.杂色植物的花瓣宽度比其他植物有更高的斜率项。

其他随机效应估计值

我们还可以使用以下代码获得ICC和伪R2估计值:

#### Check Performance ####
performance(fit)

如下所示:

# Indices of model performance

AIC     |    AICc |     BIC | R2 (cond.) | R2 (marg.) |   ICC |  RMSE | Sigma
-----------------------------------------------------------------------------
154.478 | 155.066 | 172.542 |      0.957 |      0.231 | 0.944 | 0.355 | 0.362

本总结中需要注意的事项:

  • ICC表明存在大量随机效应聚类...准确地说约为94.4%,表明大部分解释方差来自模型中的随机效应。
  • 条件R2是由固定效应和随机效应解释的方差,结果为95.7%。
  • 边际R2表示固定效应解释了多少方差,约为23.1%。
引文

下面是我之前提到的引文。Gelman & Hill是学习混合模型的权威来源。Meteyard & Davies的文章是运行混合模型的最佳实践指南。如果你觉得这个答案有帮助,请告诉我。

  • Gelman,A.和Hill,J.(2007年),《使用回归和多水平/层次模型进行数据分析》,剑桥大学出版社。
  • Meteyard,L.,& Davies,R. A. I.(2020)。心理科学中线性混合效应模型的最佳实践指南。《记忆与语言杂志》,112,104092。https://doi.org/10.1016/j.jml.2020.104092

相关问题