R语言如何在混合效应模型中报告随机效应

我使用R中的iris数据集作为下面的示例。

library(lme4)
mixed.fit.b <- lmer(Sepal.Width ~ Sepal.Length + (1+ Sepal.Length|Species), data = iris)
summary(mixed.fit.b)

ranef(mixed.fit.b)$Species
coef(mixed.fit.b)$Species
predict(mixed.fit.b)

随机截距和斜率如下所示。

(Intercept) Sepal.Length
setosa     -0.49549054   0.78331501
versicolor  1.19197858   0.26689317
virginica   1.17260303   0.27282273

这意味着截距为-0.49549054（固定截距+随机截距），斜率为0.78331501（固定+随机斜率），对吧？所以，有三对截距和斜率，在一般的线性模型中，我们可以说y =截距+斜率，y每改变x一个斜率，但在混合模型中，有三对截距和斜率。2如何报告它们？

建议

我同意Roland的观点，即使用三个集群的混合模型是不可取的（见Gelman & Hill，2007，链接如下）谈到你的主要问题，我们想知道有多少随机变异被模型区分开，事实上，这真的应该被用作首先使用模型的理由（参见Meteyard & Davies，2020，他们建议拟合仅随机效应模型作为完整模型的前身）。
考虑到这一点，我建议您报告模型的以下部分，以考虑随机效应（包括您提到的）。虽然这些部分并非都是必要的，但它们肯定提供了信息：

随机截距/随机斜率的SD
任何随机效应的相关性（如可能，解释原因）
模型的ICC（这将说明发生了多少聚类）
伪R2，尝试解释固定效应可以解释多少效应，固定效应和随机效应可以解释多少效应。
随机效应的卡特彼勒图。

工作示例：拟合模型

我将继续使用您现有的数据作为示例，但我会将其更改为收敛的数据，因为您的第一个模型是单一的，在报告时无法使用。我已经加载了所用函数所需的四个库，并适合模型。

#### Load Libraries ####
library(lmerTest)
library(lattice)
library(broom.mixed)
library(performance)

#### Fit Model ####
fit <- lmer(Petal.Length
                    ~ Petal.Width
                    + (1 + Petal.Width |Species), 
                    data = iris)

总结随机效应方差

接下来，我们可以总结一下模型，但是我更喜欢使用broom.mixed包中的tidy函数来快速获得RE估计值。

##### Summarise Model ####
tidy(fit)

如下所示：

# A tibble: 6 × 8
  effect   group    term                      estim…¹ std.e…² stati…³    df p.value
  <chr>    <chr>    <chr>                       <dbl>   <dbl>   <dbl> <dbl>   <dbl>
1 fixed    NA       (Intercept)                 2.43    0.898    2.71  1.97   0.115
2 fixed    NA       Petal.Width                 1.10    0.414    2.65  2.00   0.118
3 ran_pars Species  sd__(Intercept)             1.52   NA       NA    NA     NA    
4 ran_pars Species  cor__(Intercept).Petal.W…  -0.408  NA       NA    NA     NA    
5 ran_pars Species  sd__Petal.Width             0.646  NA       NA    NA     NA    
6 ran_pars Residual sd__Observation             0.362  NA       NA    NA     NA    
# … with abbreviated variable names ¹estimate, ²std.error, ³statistic

根据这些信息，我们现在知道：

在控制固定和随机效应后，物种的条件平均花瓣长度变化约1.52SD。
不同物种的斜率变化较小（.646 SD），表明花瓣宽度和花瓣长度之间的关系在不同物种之间变化不大。
花瓣宽度和花瓣长度之间的相关性约为-. 41，表明随着平均花瓣长度的增加，斜率通常会降低。

上面引用的一篇文章的The appendix显示了如何报告此信息，如果我没有记错的话，这是您的主要问题。

卡特彼勒随机效应图

如有必要，我们可以在文章中报告这一信息，但也可以使用毛毛虫图绘制这些效应：

#### Plot Dotplot of Random Effects ####
dotplot(ranef(fit))

这也是Roland提醒您随机效应聚类数量较多的部分原因。您在此处只看到三个截距和斜率，无法捕捉到您希望从混合模型中获得的大量变异。然而，我们可以在此处获得两个关键见解：
1.维吉尼亚植物的平均花瓣长度（随机截距）比其他物种高得多。
1.杂色植物的花瓣宽度比其他植物有更高的斜率项。

其他随机效应估计值

我们还可以使用以下代码获得ICC和伪R2估计值：

#### Check Performance ####
performance(fit)

如下所示：

# Indices of model performance

AIC     |    AICc |     BIC | R2 (cond.) | R2 (marg.) |   ICC |  RMSE | Sigma
-----------------------------------------------------------------------------
154.478 | 155.066 | 172.542 |      0.957 |      0.231 | 0.944 | 0.355 | 0.362

本总结中需要注意的事项：

ICC表明存在大量随机效应聚类...准确地说约为94.4%，表明大部分解释方差来自模型中的随机效应。
条件R2是由固定效应和随机效应解释的方差，结果为95.7%。
边际R2表示固定效应解释了多少方差，约为23.1%。

引文

下面是我之前提到的引文。Gelman & Hill是学习混合模型的权威来源。Meteyard & Davies的文章是运行混合模型的最佳实践指南。如果你觉得这个答案有帮助，请告诉我。

Gelman，A.和Hill，J.（2007年），《使用回归和多水平/层次模型进行数据分析》，剑桥大学出版社。
Meteyard，L.，& Davies，R. A. I.（2020）。心理科学中线性混合效应模型的最佳实践指南。《记忆与语言杂志》，112，104092。https://doi.org/10.1016/j.jml.2020.104092

R语言如何在混合效应模型中报告随机效应

1条答案

建议

工作示例：拟合模型

总结随机效应方差

卡特彼勒随机效应图

其他随机效应估计值

引文

相关问题

热门标签

最新问答

R语言 如何在混合效应模型中报告随机效应

1条答案

建议

工作示例：拟合模型

总结随机效应方差

卡特彼勒随机效应图

其他随机效应估计值

引文

相关问题

热门标签

最新问答

R语言如何在混合效应模型中报告随机效应