unilm 在某些epoch之后无法恢复训练,

bqjvbblv  于 1个月前  发布在  其他
关注(0)|答案(2)|浏览(34)

我有一个预训练模型,已经进行了20个epoch。当我尝试从第0个epoch开始恢复时,如何再次在同一epoch上继续?请帮忙。

pgky5nke

pgky5nke1#

@mahadevchavan 你能发布训练命令和详细信息吗?

yqhsw0fo

yqhsw0fo2#

python run_beit_pretraining.py --output_dir /workspace/nvidia/pradeep/output/ --num_workers 0 --log_dir /workspace/nvidia/pradeep/log_dir/ --batch_size 96 --resume /workspace/nvidia/pradeep/output/checkpoint-29.pth

相关问题