vllm 结合多LoRa和量化

dzhpxtsq 于 2个月前发布在其他

关注(0)|答案(3)|浏览(93)

没有根本原因说明为什么多LoRA不能与量化模型一起工作。我们很可能希望保持LoRA的未量化状态，并在应用具有punica内核的LoRA之前对基本模型输出进行去量化。这似乎也是其他项目中存在的现象。

最初由@Yard1在#1804(评论)中发布*

来源：https://github.com/vllm-project/vllm/issues/2601

3条答案

按热度按时间

关于这个问题，大家有没有取得什么进展？或者有人尝试过使用不同的量化来测试多LoRa,看看哪种方法可能有效吗？

赞(0）回复(0）举报 2个月前

Yard1,这个支持有什么计划吗？这真的取决于这个很棒的功能，也需要了解实际效果。谢谢。

赞(0）回复(0）举报 2个月前

@thincal #4012

赞(0）回复(0）举报 2个月前

相关问题

热门标签

Java query python Node 开发语言 request Util 数据库 Table 后端算法 Logger Message Element Parser

最新问答

xxl-job 安全组扫描到执行器端口服务存在信息泄露漏洞
回答(1) 发布于 21天前
xxl-job 不能和nacos兼容？
回答(3) 发布于 21天前
xxl-job 任务执行完后无法结束，日志一直转圈
回答(3) 发布于 21天前
xxl-job-admin页面上查看调度日志样式问题
回答(1) 发布于 21天前
xxl-job 参数512字符限制能否去掉
回答(1) 发布于 21天前