ludwig 不适当的保存合并的经过微调的llama-2模型

hujrc8aj  于 2个月前  发布在  其他
关注(0)|答案(4)|浏览(44)

您好,根据您的描述,您正在尝试微调llama-2模型,但是磁盘大小只有7.6MB。这可能是由于合并和卸载过程没有正确完成导致的。您可以尝试以下方法来解决此问题:

  1. 检查您的代码是否正确执行了合并和卸载过程。如果没有,请参考相关文档或教程进行修改。
  2. 检查您的硬件配置是否满足llama-2模型的微调要求。例如,RTX 3080就可以微调最小模型。
  3. 如果您的硬件配置不足以微调llama-2模型,则需要对数据盘进行扩容。
ego6inou

ego6inou1#

你好,raghavbj24 -感谢你提交这个问题!我有一个问题想问你:我看到你的base_model/home/ubuntu/llama-2-7b-hf_for_merge。如果你尝试使用https://huggingface.co/meta-llama/Llama-2-7b-hf中的meta-llama/Llama-2-7b-hf,是否会发生相同的"小尺寸"现象?请让我知道。谢谢。

ki0zmccv

ki0zmccv2#

你好,@alexsherstinsky。根据你的建议,我尝试了huggingface的base模型meta-llama/Llama-2-7b-hf,但是没有发现任何差异,而且保存的模型大小非常小。

x3naxklr

x3naxklr3#

raghavbj24,请问您的模型保存在HuggingFace的哪个位置?能否让我以"只读"权限访问它?我将在接下来的几天里深入研究。谢谢。

myss37ts

myss37ts4#

@raghavbj24 In parallel, if you do not mind: could you please rerun your experiment using this base model: alexsherstinsky/Mistral-7B-v0.1-sharded -- and let me know here what you see for the merged model size (and please also tell me the location where it will be saved). Thank you very much for your collaboration.

相关问题