vllm [新模型]:Qwen1.5-MoE-A2.7B-Chat-GPTQ-Int4启动错误

ohfgkhjo  于 2个月前  发布在  其他
关注(0)|答案(3)|浏览(68)

要考虑的模型。

https://modelscope.cn/models/qwen/Qwen1.5-MoE-A2.7B-Chat-GPTQ-Int4/

已经支持的最接近的模型vllm。

https://modelscope.cn/models/qwen/Qwen1.5-MoE-A2.7B-Chat/

支持您想要的模型的困难是什么?

启动错误:MergedColumnParallelLinear对象没有属性weight

xxb16uws

xxb16uws1#

目前,vllm不支持qwen-moe量化。

a8jjtwal

a8jjtwal2#

跪地支撑,屈文墨。

8cdiaqws

8cdiaqws3#

跪地支撑,屈文墨。

相关问题