EasyOCR 有没有一种方法可以在准确性和速度之间进行权衡?

e4yzc0pl  于 3个月前  发布在  其他
关注(0)|答案(4)|浏览(42)

我正在构建一个需要快速OCR的应用。从一个小图像中获取文本需要大约50毫秒,但我希望将其缩短到10毫秒。在我的用例中,我不需要获得完美的预测结果,所以我想用速度换取准确性。
有简单的方法可以实现吗?

qltillow

qltillow1#

你或许可以尝试使用pytesseract。

ogsagwnx

ogsagwnx2#

嗯,@majunze2001 我尝试了pytesseract,但它既慢又准确度低。

n6lpvg4x

n6lpvg4x3#

降低输入分辨率,将其转换为黑白(通过阈值处理只保留黑色或白色像素,而不是灰度),使用GPU(或更好的GPU)。神经网络需要的时间取决于其需求,EasyOCR无法改变其提高速度的操作。

nle07wnf

nle07wnf4#

除了@JulianOrteil的建议,您还可以尝试模型压缩技术,如剪枝(量化和fp32-fp16转换,但这些方法的速度提升相对较小),以提高速度并显著降低模型使用的内存(模型加载时间也会减少)。

相关问题