Firefly-LLaMA2-Chinese
Firefly-LLaMA2-Chinese copied to clipboard
baichaun2-13b增量预训练loss为0
作者你好,我使用baichuan2-13b做增量cpt时候loss一直是0. 我使用自己的数据集或是CNEWsum.jsonl都是0.
真没搞懂作者训练baichuan的作用是啥