DeepSpeed-MII 如何进行令牌流式传输?

gojuced7  于 3个月前  发布在  其他
关注(0)|答案(1)|浏览(47)

使用client = mii.serve(model),我们需要提供一个回调函数,如何正确地流式传输令牌?

xmq68pz9

xmq68pz91#

你好@mevince,我们目前正在为#311提供适当的流支持。您可以使用pip install git+https://github.com/Microsoft/DeepSpeed-MII@jeffra/readable-streaming尝试该分支。描述中有示例代码,说明如何进行令牌流处理。

相关问题