vllm 在4xA100 cuda=12.1, pytorch=2.1.2环境下运行混合模型Mixtral-8x7B失败,

tct7dpnv  于 2个月前  发布在  其他
关注(0)|答案(1)|浏览(43)

显示错误信息:
"cupy_backends.cuda.libs.nccl.NcclError: NCCL_ERROR_INVALID_USAGE: invalid usage"
这个错误发生在vllm==0.3.2时,而vllm==0.2.7可以正常工作。
要重现它:

python -m vllm.entrypoits.api_server --model mistralai/Mixtral-8x7B-v0.1 --tensor-parallel-size 2
vom3gejh

vom3gejh1#

当我使用TP=2运行OPT-30B模型时,出现了相同的错误。我使用的是torch==2.1.1,cuda=11.8,vllm==0.3.3。

相关问题