MedicalGPT 关于merge模型的格式问题

关于merge模型的格式问题

Open tszslovewanpu opened this issue 1 year ago • 2 comments

Describe the Question

Please provide a clear and concise description of what the question is. 感谢分享工作！ SFT训练还没结束时，我选了其中一个保存的checkpoint，使用merge_peft_adapter.py融合llama2-7B和这个lora model，但是最终融合的文件后缀是这样的model-00001-of-00002.safetensors，很奇怪，我想在这个融合模型基础上继续做SFT就不行了，不知道为何。。。

Nov 05 '23 04:11 tszslovewanpu

base_model.save_pretrained(output_dir, max_shard_size='10GB', safe_serialization=True) 改为 base_model.save_pretrained(output_dir, safe_serialization=False)

Nov 05 '23 06:11 shibing624

感谢！

Nov 05 '23 17:11 tszslovewanpu

MedicalGPT MedicalGPT copied to clipboard

关于merge模型的格式问题

Describe the Question

MedicalGPT
MedicalGPT copied to clipboard