DeepSpeed-MII 无法运行llama-2-7B和llama-2-13B,

fkvaft9z 于 3个月前发布在其他

关注(0)|答案(2)|浏览(48)

在使用DeepSpeed-MII与Llama-2模型时，遇到了两个问题。首先是无法将慢速tokenizer转换为快速tokenizer的错误，提示需要安装sentencepiece库。其次是在尝试将llama-2-13B-chat替换为llama-2-7B-chat时，遇到了另一个错误。

针对第一个问题，可以尝试安装sentencepiece库：

pip install sentencepiece

然后在加载tokenizer时，使用sentencepiece库进行转换：

from transformers import AutoTokenizer
import sentencepiece as spm

def load_tokenizer(model_config):
    tokenizer = AutoTokenizer.from_pretrained(model_config.tokenizer)
    spm.SentencePieceTrainer.train(input_file=model_config.tokenizer, model_prefix="spm", vocab_size=10000)
    return tokenizer

针对第二个问题，需要检查代码中是否有关于模型配置的部分，可能需要根据不同的模型版本进行相应的调整。
这个错误信息表示在运行过程中，服务器因为某种原因崩溃了。具体来说，是在/home/DeepSpeed-MII/mii/backend/server.py文件的第62行抛出了一个RuntimeError,导致无法继续执行。

要解决这个问题，你需要检查服务器崩溃的原因。可能的原因包括内存不足、CPU过载、代码错误等。你可以尝试以下方法：