是否存在相同错误的现有问题?
- 我已检查了现有的问题。
分支名称
main
提交ID
其他环境信息
- 无响应*
实际行为
在部署docker-compose-gpu-CN.yml时,出现错误 "NCCL Error 2: unhandled system error (run with NCCL_DEBUG=INFO for details)"。
预期行为
- 无响应*
重现步骤
When inputting the question, it would answer the question at the first time, but halfway through the answer, the error "NCCL Error 2: unhandled system error (run with NCCL_DEBUG=INFO for details)" popped up. Subsequently, this error message was directly displayed for the subsequent responses.
其他信息
- 无响应*
1条答案
按热度按时间yqkkidmi1#
NCCL是GPU之间连接的驱动程序。如果没有正确安装或者硬件不支持,可能会出现问题。因此,建议仅使用一个GPU。