top_k = 50 will make vllm prediction align with transformers

332nm8kg  于 2个月前  发布在  其他
关注(0)|答案(1)|浏览(23)

关于vllm和transformers之间的不同结果有很多问题。其中一些是由于vllm样本实现(如重复)引起的,或者是由于内核实现错误引起的。这些错误已在最新的vllm版本中修复。
当我测试vllm的最新版本时,我仍然得到了与transformers不同的结果。经过一些调查,我发现vllm和transformers之间的默认top_k值不同。Transformer的默认top_k为50,vllm的默认top_k为-1
我测试了将vllm的top_k设置为50,结果与transformers相同。
希望这能有所帮助。

相关问题