我有一个由不同特征组成的数据集,比如“性别”。模型的任务是确定年收入是高于还是低于50k。假设我有一个经过训练的网络来进行分类。现在,我想看看分类器根据性别特征进行分组,从而分别做出假阳性和假阴性预测的频率。其基本思想是某种类型的混淆矩阵,但不是类到类的矩阵,而是类到特征的矩阵。下图说明了我想要的结果。
dfuffjeb1#
其基本思路如下:1)使用网络进行预测。2)将预测值设置为数据集中的新列,现在您有了新的数据集data_new您的数据集现在有两列,一列用于预测值,另一列用于真值。您可以通过布尔比较来计算总体准确性(1和1分别为正确的预测,0和1以及1和0分别为错误的预测)。3)现在您可以为任何您想要的列筛选新数据,因此在我的例子中为特定的性别。4)现在您可以计算所选性别的准确性。
1条答案
按热度按时间dfuffjeb1#
其基本思路如下:
1)使用网络进行预测。2)将预测值设置为数据集中的新列,现在您有了新的数据集data_new
您的数据集现在有两列,一列用于预测值,另一列用于真值。您可以通过布尔比较来计算总体准确性(1和1分别为正确的预测,0和1以及1和0分别为错误的预测)。
3)现在您可以为任何您想要的列筛选新数据,因此在我的例子中为特定的性别。
4)现在您可以计算所选性别的准确性。