EasyOCR 对于测试数据上的不良结果的帮助

kjthegm6  于 3个月前  发布在  其他
关注(0)|答案(1)|浏览(33)

你好
我为波斯语和英语数据训练了这个模型,但是在使用90%准确率的训练权重在读者功能和推理模型上进行测试后,我得到了不好的结果。我的结果就像是重复了一些单词,甚至与正确的标签相差甚远。我也尝试在我的训练数据上进行测试,但它也无法识别标签。我在训练模型之前使用了easyocr,并且在用于测试和训练的图片上也能够识别,但是在我的数据上训练后就无法识别了。所以有人能告诉我我哪里出错了吗?

isr3a4wc

isr3a4wc1#

我猜你的数据集不够多样化,这意味着模型对输入的自定义数据过拟合。为了解决这个问题,你需要一个大型且多样化的数据集,你可以通过合成生成来实现这一点。如果你对此感兴趣,我在TowardsAI上发表了一篇关于这个的文章:https://pub.towardsai.net/how-to-make-a-synthesized-dataset-to-fine-tune-your-ocr-3573f1a7e08b 。此外,我会尝试使用较少的数据进行训练(例如通过降低学习率,或运行更少的迭代次数/周期的微调),因为这有助于防止过拟合。

相关问题