ragflow [Bug]: NCCL错误2:未处理的系统错误(使用NCCL_DEBUG=INFO运行以获取详细信息)

m528fe3b  于 2个月前  发布在  其他
关注(0)|答案(1)|浏览(77)

是否存在相同错误的现有问题?

  • 我已检查了现有的问题。

分支名称

main

提交ID

bf2ea04

其他环境信息

  • 无响应*

实际行为

在部署docker-compose-gpu-CN.yml时,出现错误 "NCCL Error 2: unhandled system error (run with NCCL_DEBUG=INFO for details)"。

预期行为

  • 无响应*

重现步骤

When inputting the question, it would answer the question at the first time, but halfway through the answer, the error "NCCL Error 2: unhandled system error (run with NCCL_DEBUG=INFO for details)" popped up. Subsequently, this error message was directly displayed for the subsequent responses.

其他信息

  • 无响应*
yqkkidmi

yqkkidmi1#

NCCL是GPU之间连接的驱动程序。如果没有正确安装或者硬件不支持,可能会出现问题。因此,建议仅使用一个GPU。

相关问题