ragflow 如何调用使用fastchat部署的模型？

gblwokeq 于 6个月前发布在其他

关注(0)|答案(1)|浏览(117)

描述你的问题

阅读相关问题，它说要使用ollama启动一个本地模型，但是https://ollama.com/library不支持ChatGLM,或者需要很多工作来支持ChatGLM和ollama的结合。此外，目前已经在使用fastchat部署其他应用程序，因此希望能够重用这个模型。请允许我使用fastchat启动一个大模型，并使用fastapi自行 Package 接口，伪装成ollama吗？
我需要向ragflow提供哪些关键接口？

来源：https://github.com/infiniflow/ragflow/issues/498

1条答案

按热度按时间

相同的需求，Ollama只是一个玩具，太难用了。统一按照OpenAI的格式接入就可以了，这已经成为业内的规范。Ollama官方提供的模型都是4bit量化的，如果想要添加自定义模型，还需要自己转换格式，而且没有VLLM推理优化。

赞(0）回复(0）举报 6个月前

相关问题

热门标签

Java query python Node 开发语言 request Util 数据库 Table 后端算法 Logger Message Element Parser

最新问答

xxl-job 安全组扫描到执行器端口服务存在信息泄露漏洞
回答(1) 发布于 5个月前
xxl-job 不能和nacos兼容？
回答(3) 发布于 5个月前
xxl-job 任务执行完后无法结束，日志一直转圈
回答(3) 发布于 5个月前
xxl-job-admin页面上查看调度日志样式问题
回答(1) 发布于 5个月前
xxl-job 参数512字符限制能否去掉
回答(1) 发布于 5个月前