EasyOCR 无法通过trainer.py训练模型,

r6hnlfcb  于 2个月前  发布在  其他
关注(0)|答案(5)|浏览(36)

As shown below,easyocr have a error when I use trainer.ipynb

Traceback (most recent call last):
  File "trainer.py", line 33, in <module>
    train(opt, amp=False)
  File "/home/EasyOCR/trainer/train.py", line 44, in train
    valid_dataset, valid_dataset_log = hierarchical_dataset(root=o
  File "/home/EasyOCR/trainer/dataset.py", line 138, in hierarchic
    concatenated_dataset = ConcatDataset(dataset_list)
  File "/opt/conda/lib/python3.8/site-packages/torch/utils/data/da
    assert len(self.datasets) > 0, 'datasets should not be an empt
AssertionError: datasets should not be an empty iterable
mccptt67

mccptt671#

我遇到了同样的问题,发现在all_data文件夹中没有正确的目录结构。你需要在all_data文件夹下创建一个en_filtered和一个en_val文件夹。将所有训练图片放在en_filtered文件夹中,将验证图片放在en_val文件夹中。不要忘记在每个文件夹中包含相应的labels.csv文件。我通过了Assert错误,但遇到了线程生成的另一个问题。

vd2z7a6w

vd2z7a6w2#

@Metcomtech,您是如何进行培训的?是在本地系统还是任何云端服务器上?请告诉我系统的配置信息,谢谢。

fdx2calv

fdx2calv3#

我在本地进行了训练。我的机器配备了Xeon Gold 5120处理器,拥有14个核心和32 Gb的内存。即使使用工作站进行训练,速度也非常慢。然而,我发现最准确的解决方案往往在训练过程的早期就出现了。较长的训练时间和更多的步骤并不保证更高的准确性。我的建议是,如果你只有一台低配置的机器,从较低的步数开始,逐步增加步数,直到验证精度开始稳定,那么这将是最好的解决方案。你可以尝试通过增加步数来延长训练,但我猜想这将是浪费时间,因为精度不会提高。

w3nuxt5m

w3nuxt5m4#

@Metcomtech,您在训练图像中有多少张图片,完成训练需要多长时间?
我正在进行25张训练图像的训练,已经花费了1小时,并且仍在运行。

pzfprimi

pzfprimi5#

你能展示一下配置吗?

相关问题