yolo3-pytorch icon indicating copy to clipboard operation
yolo3-pytorch copied to clipboard

模型稳定性问题

Open Q-amazing opened this issue 4 years ago • 1 comments

老师您好: 我在复现你的代码的过程中,遇到一个问题:在同一配置下,用两块GPU同时运行train.py训练模型并得到两个model,预测的mAP值最多可相差10%,分别为86%、96%。我尝试下面几种方法进行实验,但是同一配置多次训练,mAP结果还是非常不稳定:(1)DataLoader的shuffle设置为False;(2)实验权重初始化,设置固定种子,torch.manual_seed(4567);(3)确保训练INPUT_SHAPE与预测的MODEL_IMAGE_SIZE参数保持一致;(4)dataloader.py取消随机增强的数据替换原始数据,random设置为False; (5)参数LR减小;(6)batch_size增加。在基于您的代码进行优化的时候,因为上述问题导致无法对比优化效果。 请问老师这种问题,该怎么处理?谢谢~

Q-amazing avatar Aug 24 '21 01:08 Q-amazing

emm首先深度学习训练理论上一定要随机,所以shuffle别关 数据增强关闭会大幅度减少模型的鲁棒性,所以也不要关。 我的建议是,把仓库重下,然后只改与训练相关的参数,测试集和训练集划分好,重复进行两次

bubbliiiing avatar Aug 28 '21 11:08 bubbliiiing