one-api 根据 token 长度自动回退至标准模型

3htmauhk 于 5个月前发布在其他

关注(0)|答案(2)|浏览(52)

例行检查

我已确认目前没有类似问题
我已确认我已升级到最新版本
我已完整查看过项目 README,已确定现有版本无法满足需求
我理解并愿意跟进此问题，协助测试和提供反馈
我理解并认可上述内容，并理解项目维护者精力有限，不遵循规则的问题可能会被无视或直接关闭

功能描述
即使选择了16k/32k的模型，根据token长度自动回退至标准模型(gpt-4, gpt-35-turbo)。

应用场景
即便没有用到4k以上的token,16k/32k的模型单位价格通常更贵。这样做的好处是节省资源消耗，并且对客户端透明。

来源：https://github.com/songquanpeng/one-api/issues/654

2条答案

按热度按时间

目前尚不清楚模型的能力是否完全一致。

赞(0）回复(0）举报 5个月前

这个操作从客户端实现不是更合理和透明？

赞(0）回复(0）举报 5个月前

相关问题

热门标签

Java query python Node 开发语言 request Util 数据库 Table 后端算法 Logger Message Element Parser

最新问答

xxl-job 安全组扫描到执行器端口服务存在信息泄露漏洞
回答(1) 发布于 4个月前
xxl-job 不能和nacos兼容？
回答(3) 发布于 4个月前
xxl-job 任务执行完后无法结束，日志一直转圈
回答(3) 发布于 4个月前
xxl-job-admin页面上查看调度日志样式问题
回答(1) 发布于 4个月前
xxl-job 参数512字符限制能否去掉
回答(1) 发布于 4个月前