ECCV2022-RIFE icon indicating copy to clipboard operation
ECCV2022-RIFE copied to clipboard

关于模型训练的问题

Open ROTTK opened this issue 1 year ago • 3 comments

作者您好!我使用您的代码在Adobe240数据集上从头开始训练模型,在训练到第30个epoch之后的模型推理出来的图片都是纯白的,第30个epoch的的模型推理出来的图片虽然比较糊但起码是正常的,请问这种情况可能是哪里出了问题呢? 为了减少训练过程中的I/O,我将训练集原有的720p视频帧划分成了120x120大小的patch,可能是因为我用的patch太小了吗?

ROTTK avatar Aug 08 '24 02:08 ROTTK

建议先打印检查一下训练和推理时的数值范围是不是一致为 0~1 我觉得 patch 应该没这么大影响

hzwer avatar Aug 08 '24 03:08 hzwer

感谢您的答复! 我看了一下发现推理出来的数全都是1.0 并且训练后期的loss_l1都是1e-1数量级的,而训练早期都是1e-2数量级,loss还越练越高了 请问这种情况要怎么处理呢?

ROTTK avatar Aug 08 '24 03:08 ROTTK

噢那有可能真是训练炸了,如果 loss 越训越高,可以把 learning rate 调小一个数量级看看 loss 能不能正常下降

hzwer avatar Aug 08 '24 08:08 hzwer