vllm 控制最大队列时间

xzabzqsa  于 2个月前  发布在  其他
关注(0)|答案(1)|浏览(34)

是否有办法控制vLLM何时拒绝请求,因为队列太长,还是让请求进入队列?

q9rjltbz

q9rjltbz1#

这真的很好!vLLM现在如何控制队列中请求的最大长度?似乎没有上限吗?它只是在利用CPU和内存吗?

相关问题