DeepSpeed-MII 推理结果与hf不一致,

5uzkadbs  于 3个月前  发布在  其他
关注(0)|答案(1)|浏览(44)

我使用mii和hf模型在两张A800显卡上对mixtral8x7b进行了推理测试。生成(),但推理结果不一致,mii的推理结果不如hf的好。

4jb9z9bj

4jb9z9bj1#

请分享提示和生成的文本。由于我们自定义的CUDA内核,我们无法确保与基线模型的输出完全匹配,但输出的质量应该是相同的。

相关问题