vllm 如何调用/添加一个新的lora模块到实时服务器?

piwo6bdm  于 2个月前  发布在  其他
关注(0)|答案(4)|浏览(45)

你好,
我正在阅读Using Lora in VLLM的文档。在文档中,当他们启动服务器时,看起来他们必须指定哪些LoRa模块可用。
--lora-modules sql-lora=~/.cache/huggingface/hub/models--yard1--llama-2-7b-sql-lora-test/
是否可以实时执行此操作?即启动服务器并调用最近添加的LoRa模块,而无需停止和重新启动服务器?

相关问题