我在AWS ml.p3.2xlarge SageMaker笔记本示例上运行ollama。当我安装最新版本0.2.1时,在一页文本上使用llama3:latest运行提取名称提示的langchain链的响应时间约为8秒,并且没有返回任何名称。然而,当我安装版本0.1.37时,响应时间降低到不到一秒钟,并得到文本中找到的人名的准确响应。
Linux
Nvidia
0.2.1
vptzau2j1#
你好,抱歉你遇到了这个问题。我正在修复,请确认一下 - 这个示例类型有 V100 GPU 对吗?
kyvafyod2#
我遇到了与NVIDIA H100 GPU类似的问题。
gzszwxb43#
我的情况和您一样,使用的是Windows 11操作系统。
3条答案
按热度按时间vptzau2j1#
你好,抱歉你遇到了这个问题。我正在修复,请确认一下 - 这个示例类型有 V100 GPU 对吗?
kyvafyod2#
我遇到了与NVIDIA H100 GPU类似的问题。
gzszwxb43#
我的情况和您一样,使用的是Windows 11操作系统。