FastGPT 为什么当加载的知识库较多时，输出的内容经常会被截断？

dly7yett 于 6个月前发布在其他

关注(0)|答案(3)|浏览(51)

为什么加载的知识库比较多时，输出的内容就经常截断？
比如问一个问题，如果是知识库里就1~2本书，大模型就会比较完整地输出内容，而如果知识库里的内容比较多，大模型输出总是输出一半就不输出了。
显卡4090*2，max-model-len 18048 足够支持长文本。
只要知识库内容一多，就会犯这种错。
麻烦看下，是否有什么解决方案？

来源：https://github.com/labring/FastGPT/issues/2093

3条答案

按热度按时间

总token超过限制，例如您设定模型输入和输出的总token数为8000,但实际输入了7000,要求输出2000。当输出达到1000时，就会超过总token限制。

赞(0）回复(0）举报 6个月前

总token超过限制，例如您设定模型输入和输出的总token数为8000,但实际输入了7000,要求输出2000。当输出达到1000时，就会超过总token限制。

感谢您的回复，但我的总token设置为18000,索引字数在4000多，这已经足够它发挥作用了。

赞(0）回复(0）举报 6个月前

我这边也发现了这个问题。请求实际上已经完成了，但不知道是不是网络原因，他的请求是一批一批过来的，中间隔了几秒，然后间隔之后可能就不输出了。前后端都没有看到任何报错。刷新页面后面的内容又显示全了。

赞(0）回复(0）举报 6个月前

相关问题

热门标签

Java query python Node 开发语言 request Util 数据库 Table 后端算法 Logger Message Element Parser

最新问答

xxl-job 安全组扫描到执行器端口服务存在信息泄露漏洞
回答(1) 发布于 5个月前
xxl-job 不能和nacos兼容？
回答(3) 发布于 5个月前
xxl-job 任务执行完后无法结束，日志一直转圈
回答(3) 发布于 5个月前
xxl-job-admin页面上查看调度日志样式问题
回答(1) 发布于 5个月前
xxl-job 参数512字符限制能否去掉
回答(1) 发布于 5个月前