RuntimeError: Distributed package doesn't have NCCL built in
jtw3ybtb1#
EOFError: 输入结束错误:torch.distributed.elastic.multiprocessing.api:失败(退出代码:1) local_rank: 0 (pid: 27316) of二进制文件:C:\anaconda\envs\clip\python.exe
sbtkgmzw2#
\n\n您好,可能是因为Windows系统不支持NCCL分布式后端。您可以参考 #57 (comment) 尝试将分布式后端设置为gloo看看,更建议在Linux系统训练。
2条答案
按热度按时间jtw3ybtb1#
EOFError: 输入结束
错误:torch.distributed.elastic.multiprocessing.api:失败(退出代码:1) local_rank: 0 (pid: 27316) of二进制文件:C:\anaconda\envs\clip\python.exe
sbtkgmzw2#
\n\n您好,可能是因为Windows系统不支持NCCL分布式后端。您可以参考 #57 (comment) 尝试将分布式后端设置为gloo看看,更建议在Linux系统训练。