ollama 自定义混合Maven的数量

2w3rbyxf 于 10个月前发布在 Maven

关注(0)|答案(3)|浏览(197)

有人能提供关于如何调整mixtral中Maven数量的指导或文档吗？我特别想了解是否有方法可以根据不同任务或场景的要求动态调整这个数量。

ollama

来源：https://github.com/ollama/ollama/issues/1553

3条答案

按热度按时间

4szc88ey1#

我不确定Ollama使用的是什么，但是对于llama.cppbackend,你可以使用以下命令在模型中覆盖一个键：

--override-kv KEY=TYPE:VALUE
                        advanced option to override model metadata by key. may be specified multiple times.
                        types: int, float, bool. example: --override-kv tokenizer.ggml.add_bos_token=bool:false

例如，我使用以下命令覆盖它们：

--override-kv llama.expert_used_count=int:3

但我认为这还不被MODELFILE支持。

赞(0）回复(0）举报 10个月前

nafvub8i2#

如何使用ollama实现？有人能帮忙吗？

赞(0）回复(0）举报 10个月前

wgxvkvu93#

你找到答案了吗？

赞(0）回复(0）举报 10个月前

我来回答

ollama 自定义混合Maven的数量

3条答案

相关问题

热门标签

最新问答