vllm 在解码过程中,是否可能传递超过1个令牌?

i2loujxw  于 2个月前  发布在  其他
关注(0)|答案(1)|浏览(43)

解:我尝试实现快速的 JSON 解码,但发现当我在一个迭代中传递2个或更多标记时,会出现非法内存访问错误。

这个想法受这篇博客的启发:

$x_{1e0f1}^{x}$

jbose2ul

jbose2ul1#

目前还不可能。但我们很期待与大纲(cc @rlouf)合作来实现这个目标。

相关问题