[Bug]: Llama 3.1 405 B FP8模型不受vLLM(v0.5.3.post1)在AMD GPU上的支持,

um6iljoc 于 2个月前发布在其他

关注(0)|答案(1)|浏览(14)

当前环境

vLLM版本：0.5.3.post1(适用于ROCm)
模型：meta-llama/Meta-Llama-3.1-405B-Instruct-FP8
AMD MI300x GPU

🐛 描述bug

在AMD MI300x GPU上加载meta-llama/Meta-Llama-3.1-405B-Instruct-FP8时，vLLM抛出值错误。
值错误：目前不支持在ROCm中使用fbgemm_fp8量化。请参阅屏幕截图以获取参考。

来源：https://github.com/vllm-project/vllm/issues/7031

1条答案

按热度按时间

你好，@jerin-scalers-ai,感谢你报告这个问题。目前，FP8不支持AMD GPU。vLLM和AMD团队正在努力解决这个问题。请保持关注。

赞(0）回复(0）举报 2个月前

相关问题

热门标签

Java query python Node 开发语言 request Util 数据库 Table 后端算法 Logger Message Element Parser

最新问答

xxl-job 安全组扫描到执行器端口服务存在信息泄露漏洞
回答(1) 发布于 21天前
xxl-job 不能和nacos兼容？
回答(3) 发布于 21天前
xxl-job 任务执行完后无法结束，日志一直转圈
回答(3) 发布于 21天前
xxl-job-admin页面上查看调度日志样式问题
回答(1) 发布于 21天前
xxl-job 参数512字符限制能否去掉
回答(1) 发布于 21天前