zzfoutofspace
Results
4
comments of
zzfoutofspace
same probem here
遇到了同样的问题:采用8*H20,使用dsz3,DPO训练rlhf-v数据集。采用dsz3会导致训练卡住且gpu利用率100%。 当切回dsz2,由于使用的是DPO,加载Kimi-VL的时候,在加载ref_model时,又会报OOM错误。 有好的解决方案么?