As shown below,easyocr have a error when I use trainer.ipynb
Traceback (most recent call last):
File "trainer.py", line 33, in <module>
train(opt, amp=False)
File "/home/EasyOCR/trainer/train.py", line 44, in train
valid_dataset, valid_dataset_log = hierarchical_dataset(root=o
File "/home/EasyOCR/trainer/dataset.py", line 138, in hierarchic
concatenated_dataset = ConcatDataset(dataset_list)
File "/opt/conda/lib/python3.8/site-packages/torch/utils/data/da
assert len(self.datasets) > 0, 'datasets should not be an empt
AssertionError: datasets should not be an empty iterable
5条答案
按热度按时间mccptt671#
我遇到了同样的问题,发现在all_data文件夹中没有正确的目录结构。你需要在all_data文件夹下创建一个en_filtered和一个en_val文件夹。将所有训练图片放在en_filtered文件夹中,将验证图片放在en_val文件夹中。不要忘记在每个文件夹中包含相应的labels.csv文件。我通过了Assert错误,但遇到了线程生成的另一个问题。
vd2z7a6w2#
@Metcomtech,您是如何进行培训的?是在本地系统还是任何云端服务器上?请告诉我系统的配置信息,谢谢。
fdx2calv3#
我在本地进行了训练。我的机器配备了Xeon Gold 5120处理器,拥有14个核心和32 Gb的内存。即使使用工作站进行训练,速度也非常慢。然而,我发现最准确的解决方案往往在训练过程的早期就出现了。较长的训练时间和更多的步骤并不保证更高的准确性。我的建议是,如果你只有一台低配置的机器,从较低的步数开始,逐步增加步数,直到验证精度开始稳定,那么这将是最好的解决方案。你可以尝试通过增加步数来延长训练,但我猜想这将是浪费时间,因为精度不会提高。
w3nuxt5m4#
@Metcomtech,您在训练图像中有多少张图片,完成训练需要多长时间?
我正在进行25张训练图像的训练,已经花费了1小时,并且仍在运行。
pzfprimi5#
你能展示一下配置吗?