ollama 在模型中心将默认量化类型设置为Q4_0(遗留格式)是否仍然有意义？

s5a0g9ez 于 6个月前发布在其他

关注(0)|答案(1)|浏览(198)

Ollama模型中心仍然使用默认的量化类型Q4_0,这是一种遗留格式，与K-quants(如Qn_K,例如Q4_K_M、Q6_K、Q5_K_L等)相比表现不佳。

将来上传到中心的模型是否将默认量化类型更改为Q4_K_M会更有意义？

参考

https://github.com/ggerganov/llama.cpp/wiki/Feature-matrix(注意，遗留量化类型甚至不会出现在特征矩阵上)。
https://github.com/ggerganov/llama.cpp/wiki/Tensor-Encoding-Schemes
https://www.reddit.com/r/LocalLLaMA/comments/1ba55rj/overview_of_gguf_quantization_methods/
困惑度(生成质量)分数ggerganov/llama.cpp#406(注解)
Difference in different quantization methods ggerganov/llama.cpp#2094
https://huggingface.co/datasets/christopherthompson81/quant_exploration

(如果已经存在此问题，抱歉-如果我的搜索失败了)

来源：https://github.com/ollama/ollama/issues/5425

1条答案

按热度按时间

我100%同意这个观点。这个决定本应该早就做出的。
由于这个原因，我在Ollama上的所有模型的默认值都是q4_K_M。

赞(0）回复(0）举报 6个月前

相关问题

热门标签

Java query python Node 开发语言 request Util 数据库 Table 后端算法 Logger Message Element Parser

最新问答

xxl-job 安全组扫描到执行器端口服务存在信息泄露漏洞
回答(1) 发布于 5个月前
xxl-job 不能和nacos兼容？
回答(3) 发布于 5个月前
xxl-job 任务执行完后无法结束，日志一直转圈
回答(3) 发布于 5个月前
xxl-job-admin页面上查看调度日志样式问题
回答(1) 发布于 5个月前
xxl-job 参数512字符限制能否去掉
回答(1) 发布于 5个月前