...

Results 1 issues of ...

感谢你出色的开源工作!请问一下LDM训练过程的损失是把以下图中两个损失加起来吗? 好像代码只用了奖励模型的损失?