Practical-RIFE icon indicating copy to clipboard operation
Practical-RIFE copied to clipboard

关于插帧任务中损失函数的疑问

Open YueChao-98 opened this issue 11 months ago • 1 comments

作者你好,感谢你为社区所做的开源工作,关于在训练插帧模型的损失函数方面 有些问题想向你请教。

我目前采用的模型也是类似RIFE这种无预训练光流模块的插帧模型,实验发现:

1)用Laplacian Loss会使模型在小物体细节上建模得更好(比如滚动的字幕),但容易出现奇怪的光流错误; 2)用L1 Loss + Vgg Loss组合 则在插帧效果上更稳定,很大程度缓解了光流出错的概率,但在小物体细节上会有退化。

我的理解是LapLoss更让模型更关注于高频细节的建模,但忽略了低频信息。请问你怎么看待这两种损失的偏好,以及在Practical-RIFE中抛弃了LapLoss的原因?

此外,我试图融合这1)2)两种损失的优点(简单的加权融合),但发现模型貌似难以收敛(加权后的PSNR都低于 单独用其中一种损失),感觉两者之间似乎存在某种对抗?想请问你有何建议。

YueChao-98 avatar Mar 15 '25 10:03 YueChao-98

你好,因为我没观察过 1) 的好处,以为是一个纯粹的刷点技巧,所以后来就没用了 我有一个想法,就是让模型出两个头,分别拟合两种 loss,然后再把两个结果按偏好加权

hzwer avatar Mar 17 '25 02:03 hzwer