Infrared-Small-Target-Detection icon indicating copy to clipboard operation
Infrared-Small-Target-Detection copied to clipboard

关于多GPU训练的问题

Open feilongzaitian337 opened this issue 1 year ago • 3 comments

作者您好,我在多GPU训练过程中发现模型效果会比单GPU训练效果差,后面发现应该是损失函数和batch的大小耦合的关系,您有遇到这个问题么

feilongzaitian337 avatar Apr 07 '23 03:04 feilongzaitian337

您好,感谢关注,理论上多卡同步训练的训练结果不会差于单卡,我们也没有用多卡训练过,不好意思。

---- 回复的原邮件 ---- | 发件人 | @.> | | 日期 | 2023年04月07日 11:04 | | 收件人 | @.> | | 抄送至 | @.***> | | 主题 | [YeRen123455/Infrared-Small-Target-Detection] 关于多GPU训练的问题 (Issue #42) |

作者您好,我在多GPU训练过程中发现模型效果会比单GPU训练效果差,后面发现应该是损失函数和batch的大小耦合的关系,您有遇到这个问题么

— Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you are subscribed to this thread.Message ID: @.***>

YeRen123455 avatar Apr 07 '23 10:04 YeRen123455

好滴,还有个问题请教一下您,我看论文实验部分没有划分测试集和验证集,您使用的验证集和测试集是一样的,这样是不是导致模型的泛化性能差呢,只是在验证集(测试集)上效果很好

feilongzaitian337 avatar Apr 13 '23 07:04 feilongzaitian337

好滴,还有个问题请教一下您,我看论文实验部分没有划分测试集和验证集,您使用的验证集和测试集是一样的,这样是不是导致模型的泛化性能差呢,只是在验证集(测试集)上效果很好

请问一下多gpu的接口原项目中有吗?好像只有--gpus,但是这个变量后面没用到?

t-zhan avatar Sep 11 '24 07:09 t-zhan