我正在构建一个需要快速OCR的应用。从一个小图像中获取文本需要大约50毫秒,但我希望将其缩短到10毫秒。在我的用例中,我不需要获得完美的预测结果,所以我想用速度换取准确性。有简单的方法可以实现吗?
qltillow1#
你或许可以尝试使用pytesseract。
ogsagwnx2#
嗯,@majunze2001 我尝试了pytesseract,但它既慢又准确度低。
n6lpvg4x3#
降低输入分辨率,将其转换为黑白(通过阈值处理只保留黑色或白色像素,而不是灰度),使用GPU(或更好的GPU)。神经网络需要的时间取决于其需求,EasyOCR无法改变其提高速度的操作。
nle07wnf4#
除了@JulianOrteil的建议,您还可以尝试模型压缩技术,如剪枝(量化和fp32-fp16转换,但这些方法的速度提升相对较小),以提高速度并显著降低模型使用的内存(模型加载时间也会减少)。
4条答案
按热度按时间qltillow1#
你或许可以尝试使用pytesseract。
ogsagwnx2#
嗯,@majunze2001 我尝试了pytesseract,但它既慢又准确度低。
n6lpvg4x3#
降低输入分辨率,将其转换为黑白(通过阈值处理只保留黑色或白色像素,而不是灰度),使用GPU(或更好的GPU)。神经网络需要的时间取决于其需求,EasyOCR无法改变其提高速度的操作。
nle07wnf4#
除了@JulianOrteil的建议,您还可以尝试模型压缩技术,如剪枝(量化和fp32-fp16转换,但这些方法的速度提升相对较小),以提高速度并显著降低模型使用的内存(模型加载时间也会减少)。