SunShirley

Results 6 comments of SunShirley

我觉得你可以先用博主自己训练好的VOC模型测试同一张图片,是不是也没有框。如果博主的模型能检测出框,你自己的没有框,说明可能是你训练的模型有问题。如果两个模型都没有框,你可以检查一下用来测试的图片中的目标不在VOC20类之中,或者是因为阈值score_threshold设置的太高了,可以把阈值调低一点

> > 我觉得你可以先用博主自己训练好的VOC模型测试同一张图片,是不是也没有框。如果博主的模型能检测出框,你自己的没有框,说明可能是你训练的模型有问题。如果两个模型都没有框,你可以检查一下用来测试的图片中的目标不在VOC20类之中,或者是因为阈值score_threshold设置的太高了,可以把阈值调低一点 > > 博主voc 77.8那个模型我测试起来没有问题,但是当我用VOC数据集跑train_voc文件的时候,生成的model文件在detect中就没有预测框出现了。。。 我没有跑过VOC,现在我正在跑COCO的,因为cuda out of memory,所以我把batch size改到2了,不知道是不是这个原因,loss的波动幅度挺大的,而且下降比较慢。我担心这样训练出来的模型,可能效果会很差。不知道你在训练过程中的参数是不是也做修改了?

> 可以先检查训练过程的loss是否正常下降,如果没有什么问题建议找一张单独的图片debug一下,查看是模型本身输出的score就十分低还是被过滤掉导致后续没有检测框出现。 > 一般训练过程中,分类与回归损失都是急剧下降后趋于稳定式缓慢下降,cnt_loss的值不稳定,这是模型本身的问题,这个值不是特别影响。 我刚刚看了一下,我的loss,感觉回归和分类损失也不是很稳定呀😥(在下面我附了一段训练的log) 博主,我的训练是不是有问题呀?因为,之前我用其他的代码(针对自己的食品分类数据集修改过的)也跑过一次,训练时loss的波动也非常大,最后的模型效果非常差(把狗检测成人的那种差😂)师兄说是可能是因为我用的那个代码在数据预处理的时候针对的是食品分类做的,不适用于coco。 globalsteps:166270 epoch:3 steps:49005/58633 clsloss:0.2632 cntloss:0.6441 regloss:0.2895 costtime:332ms lr=1.0000e-04 totalloss:1.1968 globalsteps:166271 epoch:3 steps:49006/58633 clsloss:0.2921 cntloss:0.6430 regloss:0.2831 costtime:302ms lr=1.0000e-04 totalloss:1.2183 globalsteps:166272 epoch:3 steps:49007/58633 clsloss:0.3191 cntloss:0.6227 regloss:0.2399...

> @Sunsherly 分类损失和回归损失下降都是不正常的,建议检查一下数据标注 模型的类别跟实际数据集类别是否对应的起来。 我训练的时候把batchsize改小了,我设置的是batchsize=2,是不是这个参数改变也不会造成这样差的结果呀?

> @Sunsherly 分类损失和回归损失下降都是不正常的,建议检查一下数据标注 模型的类别跟实际数据集类别是否对应的起来。 我前几天刚刚用这个数据集跑过YOLOv5,训练和测试都很正常,那是不是可以排除数据集有问题呀?

> @Sunsherly 建议不要太少的batchsize,梯度下降不稳定。 嗯嗯,等我这个跑完,我测试一下效果。如果不太行的话,我再换台服务器,把batchsize设置的大一些,重新训练。谢谢!