关于插帧任务中损失函数的疑问

Open YueChao-98 opened this issue 11 months ago • 1 comments

作者你好，感谢你为社区所做的开源工作，关于在训练插帧模型的损失函数方面有些问题想向你请教。

我目前采用的模型也是类似RIFE这种无预训练光流模块的插帧模型，实验发现：

1）用Laplacian Loss会使模型在小物体细节上建模得更好（比如滚动的字幕），但容易出现奇怪的光流错误； 2）用L1 Loss + Vgg Loss组合则在插帧效果上更稳定，很大程度缓解了光流出错的概率，但在小物体细节上会有退化。

我的理解是LapLoss更让模型更关注于高频细节的建模，但忽略了低频信息。请问你怎么看待这两种损失的偏好，以及在Practical-RIFE中抛弃了LapLoss的原因？

此外，我试图融合这1）2）两种损失的优点（简单的加权融合），但发现模型貌似难以收敛（加权后的PSNR都低于单独用其中一种损失），感觉两者之间似乎存在某种对抗？想请问你有何建议。

Mar 15 '25 10:03 YueChao-98

你好，因为我没观察过 1) 的好处，以为是一个纯粹的刷点技巧，所以后来就没用了我有一个想法，就是让模型出两个头，分别拟合两种 loss，然后再把两个结果按偏好加权

Mar 17 '25 02:03 hzwer