ollama 运行最新版本0.2.1时运行缓慢，对于长文本输入没有返回输出,

sz81bmfz 于 6个月前发布在其他

关注(0)|答案(3)|浏览(118)

问题是什么？

我在AWS ml.p3.2xlarge SageMaker笔记本示例上运行ollama。
当我安装最新版本0.2.1时，在一页文本上使用llama3:latest运行提取名称提示的langchain链的响应时间约为8秒，并且没有返回任何名称。
然而，当我安装版本0.1.37时，响应时间降低到不到一秒钟，并得到文本中找到的人名的准确响应。

操作系统

Linux

GPU

Nvidia

CPU

无响应*

Ollama版本

0.2.1

来源：https://github.com/ollama/ollama/issues/5602

3条答案

按热度按时间

你好，抱歉你遇到了这个问题。我正在修复，请确认一下 - 这个示例类型有 V100 GPU 对吗？

赞(0）回复(0）举报 6个月前

我遇到了与NVIDIA H100 GPU类似的问题。

赞(0）回复(0）举报 6个月前

我的情况和您一样，使用的是Windows 11操作系统。

赞(0）回复(0）举报 6个月前

相关问题

热门标签

Java query python Node 开发语言 request Util 数据库 Table 后端算法 Logger Message Element Parser

最新问答

xxl-job 安全组扫描到执行器端口服务存在信息泄露漏洞
回答(1) 发布于 4个月前
xxl-job 不能和nacos兼容？
回答(3) 发布于 4个月前
xxl-job 任务执行完后无法结束，日志一直转圈
回答(3) 发布于 4个月前
xxl-job-admin页面上查看调度日志样式问题
回答(1) 发布于 4个月前
xxl-job 参数512字符限制能否去掉
回答(1) 发布于 4个月前