ollama 在macOS上拆分层会给出不正确的输出

lawou6xi 于 6个月前发布在 Mac

关注(0)|答案(4)|浏览(66)

问题是什么？

在运行mixtral:8x22b时，它无法给出任何有意义的结果：

>>> What is the capital of france? ANSWER:
	

>>> hi
	#" #$

>>>

只是一些无意义的字符

你期望看到什么？

当我运行

ollama run dolphin-mixtral

输出是

>>> What is the capital of france? ANSWER:
 The capital of France is Paris.

重现步骤

我在OSX 14.1.1(M2 Max / 96 GB RAM)上运行ollama 0.1.32

是否有最近的更改引入了这个问题？

没有回应*

操作系统

macOS

架构

arm64

平台

没有回应*

Ollama版本

0.1.32

GPU

Apple

GPU信息

M2 MAX / 96GB RAM

CPU

Apple

其他软件

没有回应*

ollama

来源：https://github.com/ollama/ollama/issues/3695

4条答案

按热度按时间

d7v8vwbk1#

在macOS上使用Wizard时，0.1.32版本的响应结果相同：带有标签的乱码响应
也许与模板有关？👋 @sebastiandeutsch

赞(0）回复(0）举报 6个月前

yrdbyhpb2#

感谢您的反馈，对此表示抱歉。我认为这可能是由于在CPU/GPU层分割模型导致的。同时，您尝试使用/set parameter num_gpu 0,答案是否变得可理解？(请注意，Mixtral 8x22b是一个文本补全模型)
此外，您是否在wizardlm2:8x22b上看到了类似的问题？

赞(0）回复(0）举报 6个月前

wfveoks03#

/set parameter num_gpu 0 成功解决了输出问题，感谢❤️

赞(0）回复(0）举报 6个月前

vsaztqbk4#

我对于所有8x22型号的设备都遇到了同样的问题，num_gpu 0可以解决这个问题，但是它们运行速度非常慢(因为在这种情况下GPU似乎无法全速运行)。

赞(0）回复(0）举报 6个月前

我来回答

ollama 在macOS上拆分层会给出不正确的输出

问题是什么？

你期望看到什么？

重现步骤

是否有最近的更改引入了这个问题？

操作系统

架构

平台

Ollama版本

GPU

GPU信息

CPU

其他软件

4条答案

相关问题

热门标签

最新问答