使用LoRa训练模型并构建适配器是可能的。但是,我在文档中没有找到如何加载和将适配器应用于基础模型进行推理的方法。这是可能的吗?如果不可能,这是计划中的吗?
xyhw6mcr1#
感谢提出问题 @kv-gits!这个问题应该由 #3572 修复,对吗 @Infernaught ?
ars1skjm2#
是的,那个PR就是应该解决预训练lora权重加载的问题。在我们将其发布之前,我正在等待关于那个PR的一些最后的反馈,但是如果你想尝试它,@kv-gits ,这里是所做的更改所在的分支:https://github.com/ludwig-ai/ludwig/tree/pretrained_adapter_weights
xj3cbfub3#
你好,@kv-gits -我想跟进一下,看看你是否能尝试使用Ludwig 0.8.6,并看看你的问题是否已解决?
3条答案
按热度按时间xyhw6mcr1#
感谢提出问题 @kv-gits!这个问题应该由 #3572 修复,对吗 @Infernaught ?
ars1skjm2#
是的,那个PR就是应该解决预训练lora权重加载的问题。在我们将其发布之前,我正在等待关于那个PR的一些最后的反馈,但是如果你想尝试它,@kv-gits ,这里是所做的更改所在的分支:https://github.com/ludwig-ai/ludwig/tree/pretrained_adapter_weights
xj3cbfub3#
你好,@kv-gits -我想跟进一下,看看你是否能尝试使用Ludwig 0.8.6,并看看你的问题是否已解决?