一些发票场景中,存在机打和印刷内容信息串行或内容覆盖的情况,影响文字识别。
请问这种情况有什么好的解决方法或者参考资料吗?
目前只查到有用图层分离技术的,但是也没给具体的可参考资料
https://www.sohu.com/a/421453436_100098532
一些发票场景中,存在机打和印刷内容信息串行或内容覆盖的情况,影响文字识别。
请问这种情况有什么好的解决方法或者参考资料吗?
目前只查到有用图层分离技术的,但是也没给具体的可参考资料
https://www.sohu.com/a/421453436_100098532
2条答案
按热度按时间ktecyv1j1#
你好,这块需要重新基于你的数据训练文本检测与识别模型
oogrdqng2#
不是吧,这种情况不是简单的重新训练文本检测和识别模型能解决的吧。
文字是重叠的,即使能够检测到文字区域,识别模型也无法准确识别出印刷字和打印字