llama.cpp 功能请求：支持Codestral Mamba

cfh9epnr 于 6个月前发布在其他

关注(0)|答案(6)|浏览(66)

功能描述

Mistral刚刚发布了新的7B编码模型。

博客文章: https://mistral.ai/news/codestral-mamba/
HF: https://huggingface.co/mistralai/mamba-codestral-7B-v0.1

动机

似乎表现得非常好，尤其是对于一个7B模型：

可能的实现

对#7727的一个扩展？

llama.cpp

来源：https://github.com/ggerganov/llama.cpp/issues/8519

6条答案

按热度按时间

mum43rcc1#

我喜欢在链接的博客文章中提到的这一点！
您可以使用 mistral-inference SDK 部署 Codestral Mamba,该 SDK 依赖于来自 Mamba GitHub 存储库的参考实现。模型还可以通过 TensorRT-LLM 进行部署。对于本地推理，请关注 llama.cpp 中的支持。您可以从 HuggingFace 下载原始权重。
这是一个非常不错的认可——很高兴看到它！

赞(0）回复(0）举报 6个月前

8mmmxcuj2#

#7727 应该为这个模型提供覆盖，但与其他 Mamba2 模型不同的是，它具有未绑定的嵌入。

赞(0）回复(0）举报 6个月前

9bfwbjaz3#

请参阅以下内容，其中有一个名为“ngroups”的参数，它会影响层归一化的操作方式：https://github.com/state-spaces/mamba/blob/c0a00bd1808881831ddf43206c69362d4df90cf7/mamba_ssm/modules/mamba2.py#L47
我们使用的是ngroups=8。如果你忘记了或者尝试使用ngroups=1,你可能会遇到问题。
祝你好运！

赞(0）回复(0）举报 6个月前

dsekswqp4#

在我们合并#8526之后，我们应该尝试为这个模型添加全面的支持。cc @compilade

赞(0）回复(0）举报 6个月前

4ngedf3f5#

我很喜欢这个。

赞(0）回复(0）举报 6个月前

gev0vcfq6#

谢谢！

赞(0）回复(0）举报 6个月前