我在不平衡的数据集上执行了一个支持向量机,在70/30中分割训练/测试。训练集中的示例数为类1的1163993和类0的234190个示例。对于测试集,我有498699个类1示例和100189个类0示例。svm的混淆矩阵如下所示:
我应该使用什么标准来评估模型?这可能是一个解决方案,使用f-avg,计算精度,回忆和f-1分数为每一类的方式:
然后通过计算每个班级的两个f-1分数的算术平均值来计算f-avg,如上表最后一行所述?
我在不平衡的数据集上执行了一个支持向量机,在70/30中分割训练/测试。训练集中的示例数为类1的1163993和类0的234190个示例。对于测试集,我有498699个类1示例和100189个类0示例。svm的混淆矩阵如下所示:
我应该使用什么标准来评估模型?这可能是一个解决方案,使用f-avg,计算精度,回忆和f-1分数为每一类的方式:
然后通过计算每个班级的两个f-1分数的算术平均值来计算f-avg,如上表最后一行所述?
1条答案
按热度按时间biswetbf1#
我假设你正在寻找一个概率评估指标。在我看来,使用auc-roc(它是使用精确度和召回率计算的)将是正确的方法,事实上对于大多数二元分类问题。
另请参阅本文。