PaddleOCR 发票场景内容信息串行或内容覆盖

nom7f22z  于 2023-02-04  发布在  其他
关注(0)|答案(2)|浏览(276)

一些发票场景中,存在机打和印刷内容信息串行或内容覆盖的情况,影响文字识别。

请问这种情况有什么好的解决方法或者参考资料吗?

目前只查到有用图层分离技术的,但是也没给具体的可参考资料
https://www.sohu.com/a/421453436_100098532

ktecyv1j

ktecyv1j1#

你好,这块需要重新基于你的数据训练文本检测与识别模型

oogrdqng

oogrdqng2#

不是吧,这种情况不是简单的重新训练文本检测和识别模型能解决的吧。
文字是重叠的,即使能够检测到文字区域,识别模型也无法准确识别出印刷字和打印字

相关问题