ollama 自定义混合Maven的数量

2w3rbyxf  于 2个月前  发布在  Maven
关注(0)|答案(3)|浏览(50)

有人能提供关于如何调整mixtral中Maven数量的指导或文档吗?我特别想了解是否有方法可以根据不同任务或场景的要求动态调整这个数量。

4szc88ey

4szc88ey1#

我不确定Ollama使用的是什么,但是对于llama.cppbackend,你可以使用以下命令在模型中覆盖一个键:

--override-kv KEY=TYPE:VALUE
                        advanced option to override model metadata by key. may be specified multiple times.
                        types: int, float, bool. example: --override-kv tokenizer.ggml.add_bos_token=bool:false

例如,我使用以下命令覆盖它们:

--override-kv llama.expert_used_count=int:3

但我认为这还不被MODELFILE支持。

nafvub8i

nafvub8i2#

如何使用ollama实现?有人能帮忙吗?

wgxvkvu9

wgxvkvu93#

你找到答案了吗?

相关问题