FlagEmbedding
FlagEmbedding copied to clipboard
在pretrain之后,不知道pretrain好的模型是哪一个?
在pretrain之后,保存的文件夹里的内容,不仅保存有checkpoint-xxxx文件夹,还有encoder_model 文件夹,还有pytorch_model.bin,training_args.bin 文件。对于checkpoint-xxxx文件夹,里面还有encoder_model文件夹,里面也有pytorch_model.bin文件。我现在有四个选择:1. 用checkpoint-xxxx文件夹里面的pytorch_model.bin,2. 用encoder_model/ 文件夹里面的pytorch_model.bin, 3. 用pytorch_model.bin 文件。4. 用checkpoint-xxxx文件夹里面的encoder_model文件夹里面的pytorch_model.bin 文件,如此众多的pytorch_model.bin 不知道该用哪一个。
每次存储会存下pytorch_model.bin,和encoder_model。pytorch_model.bin是所有参数权重,包括encoder和decoder;encoder_model是encoder模型的参数,后续进行微调只需要encoder_model即可。 保存的文件夹里的pytorch_model.bin是训练完后存储的,checkpoint-xxxx是训练了xxxxxstep时存储的模型。