你好,
我正在阅读Using Lora in VLLM的文档。在文档中,当他们启动服务器时,看起来他们必须指定哪些LoRa模块可用。--lora-modules sql-lora=~/.cache/huggingface/hub/models--yard1--llama-2-7b-sql-lora-test/
是否可以实时执行此操作?即启动服务器并调用最近添加的LoRa模块,而无需停止和重新启动服务器?
你好,
我正在阅读Using Lora in VLLM的文档。在文档中,当他们启动服务器时,看起来他们必须指定哪些LoRa模块可用。--lora-modules sql-lora=~/.cache/huggingface/hub/models--yard1--llama-2-7b-sql-lora-test/
是否可以实时执行此操作?即启动服务器并调用最近添加的LoRa模块,而无需停止和重新启动服务器?
4条答案
按热度按时间busg9geu1#
我同意你的观点。
a14dhokn2#
可能非常有帮助
6mw9ycah3#
我正在添加这个功能。
9w11ddsr4#
#3446