FlagEmbedding
FlagEmbedding copied to clipboard
进行模型微调时,突然loss跳到0.0后一直在0.0
T5模型没有cls token,需要使用mean pooling方式:--sentence_pooling_method mean
谢谢回复。 我使用的就是mean,看我列的参数
我打印了训练过程中的一些参数,发现scores中出现Nan,是否跟这个有关,如何解决
您好,t5训练为向量模型需要更细致的调整参数,个人也一直没有成功训好过t5 model,无法给出有效建议。