Baichuan-7B icon indicating copy to clipboard operation
Baichuan-7B copied to clipboard

[Question] 当继续预训练是,loss一直是2.2几的状态,请问作者预训练阶段也是如此吗?

Open chenglu66 opened this issue 1 year ago • 2 comments

Required prerequisites

Questions

我自己继续预训练,采用loara方法,训练参数大约在1千万,120w条数据,训练3轮,发现loss降低很少,始终维持在2.2几的样子,想问下这个正常吗?因为我之前没有NLP的经验。

Checklist

  • [X] I have provided all relevant and necessary information above.
  • [X] I have chosen a suitable title for this issue.

chenglu66 avatar Jul 10 '23 03:07 chenglu66

请问您找到原因了吗

parkLGW avatar Jul 20 '23 08:07 parkLGW

遇到的相同的问题,loss在2.3左右震荡

yangjianxin1 avatar Aug 21 '23 16:08 yangjianxin1