[用法]:为运行vLLM推荐的CPU设置 ```markdown [用法]:为运行vLLM推荐的CPU设置 ```

lzfw57am  于 2个月前  发布在  其他
关注(0)|答案(1)|浏览(18)

如何使用vLLM

在CPU上运行vLLM以获得高性能的推荐设置是什么?例如,如果我有一个双插槽服务器,每个插槽有96个核心,应该分配多少个核心(--cpuset-cpus)来运行多个vLLM副本?

相关问题