EasyOCR 自有检测模型

5tmbdcev  于 4个月前  发布在  其他
关注(0)|答案(1)|浏览(46)

你好,

我正在尝试在具有以下格式的图片上训练自己的文本检测模型:

我只想要提取时钟和当前季度:

  1. 图片:[1ST, 13:52]
  2. 图片:[1ST, 8:38]
  3. 图片:[1ST, 722]
    由于没有标签的测试数据集,所以我想自己创建时间和季度的图片,用 TextRecognitionDataGenerator 替换给定的时间和季度,用小图片表示时间戳和季度。

我已经在使用提供的脚本进行训练了。但是我对训练参数有一些问题。

  1. 你是否会使用上面描述的方法来生成测试数据集,还是有其他更简单的解决方案?
  2. 如果盒子里还有其他不应该被识别的文本,这会不会影响结果?
  3. 为了获得接近0.9的高精度结果,我需要多少个训练图片和验证图片?
  4. 训练脚本提供了一个字符和符号列表,这些应该被检测到。我应该只提供必要的字符吗?还是认为提供所有字符更好?
  5. 根据训练数据的数量,你建议使用什么批量大小和迭代次数?
  6. 有没有可能让模型知道在图片中搜索的位置?或者实现的CRAFT模型已经检测到看起来像字符或符号的所有内容了吗?
ddrv8njm

ddrv8njm1#

If your aim is accuracy around 0.9, you can probably make it without training. Have you try vanilla model and a few argument setting ... something like, allowlist = '0123456789STNDRTH:'

相关问题