pandas 基于python的多类随机森林混淆矩阵的打印

1qczuiv0 于 2022-12-25 发布在 Python

关注(0)|答案(1)|浏览(186)

我正在使用sklearn。RandomForestClassifier，我有11个类。我的数据在 Dataframe 中，所有变量都是热编码的。类是字符串，如“Potato”，“Tomato”，“Straberry”等。
当我尝试打印混淆矩阵时，我得到了以下内容：

print(pd.crosstab(y_test, y_pred))

Error: If using all scalar values, you must pass an index

传递索引时：

print(pd.crosstab(y_test, y_pred, index = [0]))

Error:crosstab() got multiple values for argument 'index'

解决这一问题的最佳方式是什么？

1条答案

这个错误说你需要传递参数“index”给crosstab，而不是一个索引，它可以帮助你遍历一个列表。你可以找到正确的方法和更多的细节here
您还可以使用以下代码在Sci-Kit Learn中绘制混淆矩阵
这段代码从用于混淆矩阵的训练数据中获取所有标签

label=y_train.unique()
label=np.sort(label)

此代码导入混淆矩阵并绘制它。plt.cm.Blues用于配色方案，clf是您的分类器，请确保使用您命名的分类器更改它。

from sklearn.metrics import plot_confusion_matrix
cm=plot_confusion_matrix(clf,X_test, y_test,labels=label,cmap=plt.cm.Blues)