vllm [Misc]:前缀缓存是否与多LoRa一起工作?

de90aj5v  于 2个月前  发布在  其他
关注(0)|答案(3)|浏览(42)

关于vllm的任何讨论。

当我使用多个lora时,我可以启用前缀缓存来提高性能吗?

fdbelqdn

fdbelqdn3#

是的
你好,不确定这是否相关。
#5475
我最近在使用前缀缓存进行多LoRa设置时遇到了一个问题。从我的分析来看,切换LoRa头可能会导致一些性能下降,不确定这是由于我的设置还是vllm中的一些错误。

相关问题