ollama 运行最新版本0.2.1时运行缓慢,对于长文本输入没有返回输出,

sz81bmfz  于 2个月前  发布在  其他
关注(0)|答案(3)|浏览(86)

问题是什么?

我在AWS ml.p3.2xlarge SageMaker笔记本示例上运行ollama。
当我安装最新版本0.2.1时,在一页文本上使用llama3:latest运行提取名称提示的langchain链的响应时间约为8秒,并且没有返回任何名称。
然而,当我安装版本0.1.37时,响应时间降低到不到一秒钟,并得到文本中找到的人名的准确响应。

操作系统

Linux

GPU

Nvidia

CPU

  • 无响应*

Ollama版本

0.2.1

vptzau2j

vptzau2j1#

你好,抱歉你遇到了这个问题。我正在修复,请确认一下 - 这个示例类型有 V100 GPU 对吗?

kyvafyod

kyvafyod2#

我遇到了与NVIDIA H100 GPU类似的问题。

gzszwxb4

gzszwxb43#

我的情况和您一样,使用的是Windows 11操作系统。

相关问题