ollama Gemma2在并行请求中工作不正确,

z4bn682m 于 2个月前发布在其他

关注(0)|答案(1)|浏览(26)

问题是什么？

我正在测试系统可以处理的多个请求。
对于Gemma2,当执行单个请求时，响应是完美的。
但是对于多个请求，响应看起来很空洞。

我尝试使用llama3进行多请求，但它在那方面表现得很好。

操作系统

Windows

GPU

Nvidia

CPU

AMD

Ollama版本

v0.1.48

来源：https://github.com/ollama/ollama/issues/5400

1条答案

按热度按时间

我无法复现。在模型完全加载到显存的GPU上，发送并行请求不会导致乱码响应。

您能分享更多关于您的设置的信息吗？模型是在GPU/CPU之间分配的吗？您有多少显存？

赞(0）回复(0）举报 2个月前

相关问题

热门标签

Java query python Node 开发语言 request Util 数据库 Table 后端算法 Logger Message Element Parser

最新问答

xxl-job 安全组扫描到执行器端口服务存在信息泄露漏洞
回答(1) 发布于 21天前
xxl-job 不能和nacos兼容？
回答(3) 发布于 21天前
xxl-job 任务执行完后无法结束，日志一直转圈
回答(3) 发布于 21天前
xxl-job-admin页面上查看调度日志样式问题
回答(1) 发布于 21天前
xxl-job 参数512字符限制能否去掉
回答(1) 发布于 21天前