R语言 解释由pdp软件包生成的部分相关图的y轴

syqv5f0l  于 2023-02-06  发布在  其他
关注(0)|答案(2)|浏览(343)

我使用caret::train()创建了一个提升回归树(方法= gbm),并得到了预测变量的相对影响输出。
现在我想知道顶级预测变量的影响方向,因此已经完成了这些变量的部分依赖图,但我不确定如何解释y轴。
我希望y轴简单地表示我的响应变量,它是二项式(存在/不存在),这样我就可以推断离水的距离是近还是远会影响存在。
预测变量到水的距离的部分相关性图示例。

gywdnpxw

gywdnpxw1#

回归的部分相关图的y轴表示自变量对因变量的边际影响。例如,如果线位于0,则对于自变量的该值,对因变量的影响为0。它不表示预测值或此变量对其他变量的相对影响。但是,您可以通过为多个自变量并排绘制多个部分相关图并共享y轴来推导相对影响。

6l7fqoea

6l7fqoea2#

如果您使用概率拟合模型,则可以使用pdp包绘制偏相关图,并将参数“prob”指定为TRUE,然后偏相关将在概率标度上返回,而不是在中心logit(red pdp documentaion)上返回。

pdp::partial(fit, "Dist_Water, type = "classification", which.class = "presence", prob = TRUE, rug = T, plot = T)

或者提取数据并使用ggplot2绘图(对于两个类)

pdp::partial(fit, "Dist_Water", type = "classification", which.class = "presence", prob = TRUE) %>%
    dplyr::mutate(class = "presence") %>%
    dplyr::bind_rows(.,
          pdp::partial(fit, "Dist_Water", type = "classification", which.class = "absence", prob = TRUE) %>%
              dplyr::mutate(class = "absence")) %>%
    ggplot(., aes(x= Dist_Water, y = yhat, col = class)) +
    geom_line() +
    cowplot::theme_cowplot()

相关问题