支持特征中的MInference,

xzlaal3s  于 6个月前  发布在  其他
关注(0)|答案(1)|浏览(46)

功能建议

为长上下文语言模型实现百万令牌提示推理,MInference速度快

动机

MInference适用于长上下文

您的贡献

相关问题