ollama 通过websocket逐步解码,替换服务器端的GBNF和JSON模式约束

a1o7rhls  于 2个月前  发布在  其他
关注(0)|答案(1)|浏览(29)

让客户端访问令牌Map,服务器将完整的Tensor提供给客户端并让客户端选择下一个令牌,然后继续解码,或者回滚之前的解码步骤。
这消除了GBNF的复杂性,并在客户端处理所有语法和决策步骤。它甚至可以与在线学习的Transformers集成。
服务器应提供以下命令:

  • 提交延续任务
  • 接受输入Tensor而不是文本
  • 请求令牌Map
  • 一个令牌向前
  • 一个令牌向后
  • 当前解码状态
ergxz8rk

ergxz8rk1#

这对于那些LangGraph IDE用户和开发者来说肯定是有帮助的。

相关问题