unilm 运行序列标注错误

yfjy0ee7 于 6个月前发布在其他

关注(0)|答案(3)|浏览(75)

问题：CUDA内存不足。尝试分配96.00 MiB(GPU 0;3.82 GiB总容量；2.76 GiB已分配；8.25 MiB可用；2.79 GiB总共被PyTorch保留)。

答案：这个错误表明你的GPU内存不足。你可以尝试以下方法来解决这个问题：

减小批量大小(batch size),这将减少每次迭代中加载到GPU内存中的数据量。
使用梯度累积(gradient accumulation),即在多个小批量上累积梯度，然后再进行一次权重更新。这样可以在不增加GPU内存需求的情况下，实现较大的批量大小。
清理不再使用的变量，以释放GPU内存。你可以使用torch.cuda.empty_cache()来清空缓存。
如果可能的话，尝试使用具有更多显存的GPU。

来源：https://github.com/microsoft/unilm/issues/242

3条答案

按热度按时间

当我尝试在只有4GB显存的GPU上微调模型时，遇到了同样的问题。我不得不将每个GPU训练批次大小降低到1,并且只能使用layoutlm基础模型。

赞(0）回复(0）举报 6个月前

你需要具有更高内存的GPU。

赞(0）回复(0）举报 6个月前

将批处理大小从16减少到8解决了我的问题。

赞(0）回复(0）举报 6个月前

相关问题

热门标签

Java query python Node 开发语言 request Util 数据库 Table 后端算法 Logger Message Element Parser

最新问答

xxl-job 安全组扫描到执行器端口服务存在信息泄露漏洞
回答(1) 发布于 5个月前
xxl-job 不能和nacos兼容？
回答(3) 发布于 5个月前
xxl-job 任务执行完后无法结束，日志一直转圈
回答(3) 发布于 5个月前
xxl-job-admin页面上查看调度日志样式问题
回答(1) 发布于 5个月前
xxl-job 参数512字符限制能否去掉
回答(1) 发布于 5个月前