我使用caret::train()创建了一个提升回归树(方法= gbm),并得到了预测变量的相对影响输出。现在我想知道顶级预测变量的影响方向,因此已经完成了这些变量的部分依赖图,但我不确定如何解释y轴。我希望y轴简单地表示我的响应变量,它是二项式(存在/不存在),这样我就可以推断离水的距离是近还是远会影响存在。预测变量到水的距离的部分相关性图示例。
caret::train()
gywdnpxw1#
回归的部分相关图的y轴表示自变量对因变量的边际影响。例如,如果线位于0,则对于自变量的该值,对因变量的影响为0。它不表示预测值或此变量对其他变量的相对影响。但是,您可以通过为多个自变量并排绘制多个部分相关图并共享y轴来推导相对影响。
6l7fqoea2#
如果您使用概率拟合模型,则可以使用pdp包绘制偏相关图,并将参数“prob”指定为TRUE,然后偏相关将在概率标度上返回,而不是在中心logit(red pdp documentaion)上返回。
TRUE
pdp::partial(fit, "Dist_Water, type = "classification", which.class = "presence", prob = TRUE, rug = T, plot = T)
或者提取数据并使用ggplot2绘图(对于两个类)
pdp::partial(fit, "Dist_Water", type = "classification", which.class = "presence", prob = TRUE) %>% dplyr::mutate(class = "presence") %>% dplyr::bind_rows(., pdp::partial(fit, "Dist_Water", type = "classification", which.class = "absence", prob = TRUE) %>% dplyr::mutate(class = "absence")) %>% ggplot(., aes(x= Dist_Water, y = yhat, col = class)) + geom_line() + cowplot::theme_cowplot()
2条答案
按热度按时间gywdnpxw1#
回归的部分相关图的y轴表示自变量对因变量的边际影响。例如,如果线位于0,则对于自变量的该值,对因变量的影响为0。它不表示预测值或此变量对其他变量的相对影响。但是,您可以通过为多个自变量并排绘制多个部分相关图并共享y轴来推导相对影响。
6l7fqoea2#
如果您使用概率拟合模型,则可以使用pdp包绘制偏相关图,并将参数“prob”指定为
TRUE
,然后偏相关将在概率标度上返回,而不是在中心logit(red pdp documentaion)上返回。或者提取数据并使用ggplot2绘图(对于两个类)