matplotlib 为什么此SHAP汇总图未显示在数据砖中?[副本]

hmtdttj4  于 2023-08-06  发布在  其他
关注(0)|答案(1)|浏览(101)

此问题已在此处有答案

Shap value plotting error on Databricks but works locally(1个答案)
24天前关闭
这篇文章是编辑并提交审查17天前.
当我运行shap.summary_plot(shap_values.values, X[input_cols]shap.summary_plot(shap_values, X[input_cols])数据块输出时
<Figure size 576x684 with 2 Axes>
代码可以正常工作,但内核重新启动并运行相同的代码时不再生成图。我有一个导入的管道模型和从RDD采样的 Dataframe ,并在上面之前运行以下代码:

import shap
explainer=shap.TreeExplainer(pipelineModel.stages[2])#gradient boosting model from pyspark pipeline
shap_values=explainer(X,check_additivity=False)#X is a dataframe the model predicts on

字符串
我已经打印了shap_values和X行,以验证它们是否包含所需的数据,并且我能够使用管道数据对数据运行预测。为什么这个代码现在只是生成而不是实际的数字<Figure size 576x684 with 2 Axes>?无论是否使用matplotlib,此问题都会持续存在,并且会显示SHAP以外的位置。我见过类似问题的其他答案,但在摘要图上使用matplotlib=True只会导致产生和错误。

jdg4fx2g

jdg4fx2g1#

我不明白为什么这是解决方案

shap_fig=shap.summary_plot(shap_values.values, X[input_cols], show=False)

display(shap_fig)

字符串
显示地物。

相关问题