ollama add LongWrtier Llama3.1 8b and LongWrtier GLM4 9b

jei2mxaa 于 3个月前发布在其他

关注(0)|答案(1)|浏览(55)

LongWriter模型擅长在单个回复中编写长篇内容。我已成功导入QuantFactory/LongWriter-llama3.1-8b-GGUF,因此可以直接上传。我尝试将QuantPanda/LongWriter-glm4-9B-GGUF中的F32版本量化为Q4_0版本，以便我能在GPU上加载所有层，但量化失败了，错误信息为“Error: quantization is only supported for F16 and F32 models”，所以请创建一个Q4_0版本并上传。

来源：https://github.com/ollama/ollama/issues/6486

1条答案

按热度按时间

我尝试导入QuantPanda/LongWriter-glm4-9B-GGUF的Q4_K_M版本，但也失败了，可能当前的Ollama版本不支持LongWriter-glm4-9B。

赞(0）回复(0）举报 4个月前

相关问题

热门标签

Java query python Node 开发语言 request Util 数据库 Table 后端算法 Logger Message Element Parser

最新问答

xxl-job 安全组扫描到执行器端口服务存在信息泄露漏洞
回答(1) 发布于 4个月前
xxl-job 不能和nacos兼容？
回答(3) 发布于 4个月前
xxl-job 任务执行完后无法结束，日志一直转圈
回答(3) 发布于 4个月前
xxl-job-admin页面上查看调度日志样式问题
回答(1) 发布于 4个月前
xxl-job 参数512字符限制能否去掉
回答(1) 发布于 4个月前