DeepSpeed-MII 一些生成的参数在查询时不起作用,

tquggr8v  于 3个月前  发布在  其他
关注(0)|答案(3)|浏览(81)

在使用DeepSpeed MII时,有一些参数在查询模型时不起作用,而在使用model.generate或使用huggingface pipelines时起作用。我也曾尝试单独使用DeepSpeed inference这些参数,发现它们也能正常工作。

对我来说有问题的参数是num_beamsbad_words_ids,但可能还有其他参数。我发现do_samplemax_lengthmin_lengthtop_ktop_ptemperaturerepetition_penaltyearly_stopping不会引起问题,但也可能有其他参数会。

ryhaxcpt

ryhaxcpt1#

在这一点上,我们支持通过查询传递的具有 intfloatboolstr 类型的kwargs(参见
DeepSpeed-MII/mii/grpc_related/proto/modelresponse.proto
Line 34 in 4040dae
| messageValue { |
)
这意味着 num_beams应该可以工作,但我们不支持 bad_words_ids 作为类型是 Iterable[int]
您能否与 num_beams 分享您看到的错误?
谢谢

tktrz96b

tktrz96b2#

我相信num_beams是我自己的错误。
有计划支持列表吗?如果添加了列表,我认为所有参数都将得到支持。

ulmd4ohb

ulmd4ohb3#

num_beams 对我不起作用。我得到了错误:

details = "Exception calling application: DeepSpeed does not support `num_beams` > 1, if this is important to you please add your request to: https://github.com/microsoft/DeepSpeed/issues/2506"

相关问题