vllm 从内存中推断出miqu-1-70b-sf-gptq(其他70b模型都正常),

yqkkidmi  于 6个月前  发布在  其他
关注(0)|答案(1)|浏览(62)

miqu-1-70b-gptq模型与其他70b模型有何不同?

bkhjykvo

bkhjykvo1#

通过Exllama v2进行推断是还可以,但速度较慢。

相关问题