基于vllm qwen7B的服务结果与原始qwen结果不一致,准确性将显著下降,

idv4meu8  于 2个月前  发布在  其他
关注(0)|答案(3)|浏览(71)

基于vllm qwen7B的服务结果与原始qwen结果不一致,准确性将显著下降。

5tmbdcev

5tmbdcev1#

对我来说也是一样,我使用的是vlm qwen14B,结果与原始的qwen14B不一致。

0s7z1bwu

0s7z1bwu3#

+1,特别是针对int4模型和批量推理条件。

相关问题