如何使用DeepSpeed-MII从DeepSpeed/Megatron-DeepSpeed训练的检查点部署LLM模型?

nle07wnf  于 2个月前  发布在  其他
关注(0)|答案(2)|浏览(85)

是否有从DeepSpeed/Megatron-DeepSpeed训练检查点部署LLM模型的示例?似乎我们只能根据其源代码使用基于MII的HuggingFace LLMs进行部署。

pn9klfpd

pn9klfpd1#

你好,@Jye-525,我们无法加载非HF检查点。请查看我们用于加载权重的检查点引擎:https://github.com/microsoft/DeepSpeed/tree/master/deepspeed/inference/v2/checkpoint
目前这不是项目的重点,但我们欢迎外部贡献!

jv2fixgn

jv2fixgn2#

我明白了,非常感谢。

相关问题