EasyOCR Fine-Tune on Korean handwritten dataset

jyztefdp 于 6个月前发布在其他

关注(0)|答案(6)|浏览(145)

亲爱的@JaidedTeam

我想微调EASY OCR的手写韩文识别，我假设预训练模型已经训练了韩文和英文词汇，我将提高EASY OCR在韩文手写识别上的准确性。如何实现？我知道如何训练自定义模型，但由于英语数据集的巨大尺寸，我不想从头开始用韩文和英文进行训练。我已经有1000万张韩文手写图片。

敬礼，
Khawar

EasyOCR

来源：https://github.com/JaidedAI/EasyOCR/issues/986

6条答案

按热度按时间

rnmwe5a21#

亲爱的@JaidedTeam

我想微调EASY OCR在手写韩文上的表现，我假设预训练模型已经在韩文和英文词汇上进行了训练，我将提高EASY OCR在韩文手写识别上的准确性。如何实现呢？我知道如何训练自定义模型，但由于英语数据集的巨大尺寸，我不想从头开始用韩文和英文进行训练。我已经有1000万张韩文手写图片。

顺祝商祺，Khawar

仅供参考，如果有用的话。我认为你不需要为检测器模型进行训练，因为它应该非常准确。你可以冻结提取层，甚至可能冻结识别模型的顺序层，然后仅在相对较小的学习率下在韩文数据集上进行微调。现代机器学习模型有很多方法来减少多元偏移，所以我认为这种方法是可行的(在我这边确实导致了一个相对较好的泰语模型)。

赞(0）回复(0）举报 6个月前

aamkag612#

亲爱的@MdotO,谢谢你的回答。是的，你是对的，我正在研究识别模型，并目前正在使用大约6M张图片对韩国识别模型进行微调。我在.yaml文件中修改了几个参数，如果你能推荐一些更好的参数给我，那就太好了。目前，在Best_accuracy on [214000/900000] is : 6.667和模型上已经无法进一步提高性能，达到了6.667。

赞(0）回复(0）举报 6个月前

dkqlctbz3#

6.67是准确率还是损失值？看起来像损失，因为6.67%的准确率本身非常低。
有很多事情可能不涉及yaml(我不确定这些细节),但即使对于参数本身，也有一些事情可以尝试！

我相信学习率太高了：应该是0.001左右(可以增加或减少十倍)
您可以通过将两个层都设置为true(或至少将特征提取层设置为true)来冻结freeze_FeatureFxtraction和freeze_SequenceModeling。
然而，为了使2生效，您需要使用JADED AI的韩语语言训练权重作为初始权重，通过在yaml文件中指定saved_model:'path_to_korean_lang_weights)来实现，否则冻结没有用处(实际上会产生负面影响)。
您可以查看经过JADED AI筛选的示例yaml以查看所有预期字段，特别是lang char字段，因为它们决定了您想要检测的语言字符。(不指定可能会导致自动确定，但我认为最好自己指定这些)
祝好运

赞(0）回复(0）举报 6个月前

deyfvvtc4#

感谢您的建议。6.67是最佳精度，您可以查看下面的结果。

[131000/900000] Train loss: 0.00137, Valid loss: 8.52225, Elapsed_time: 175221.94042
Current_accuracy : 3.333, Current_norm_ED  : 0.5855
Best_accuracy    : 6.667, Best_norm_ED     : 0.6071