tensorflow-serving-yolov3 icon indicating copy to clipboard operation
tensorflow-serving-yolov3 copied to clipboard

giou_loss 不下降!

Open StarStar-666 opened this issue 3 years ago • 14 comments

大佬,total_loss 会下降,但是giou_loss 震荡,一开始就在震荡,大概在5左右徘徊。而且最后模型收敛在7 左右,giou_loss 模型不收敛 怎么办呀

StarStar-666 avatar Mar 25 '21 12:03 StarStar-666

数据量多少, 均衡么, batch_size呢

Byronnar avatar Mar 26 '21 09:03 Byronnar

训练集数据量是1000,识别类别是pig, 只有一类。batch_size = 4,显卡不够。大佬,可以加你个联系方式么,遇到的问题挺多的。代码能跑,就是训练集损失下降的问题,希望你能解答哈。

问题是这样的:total_loss 会降,一开始训练第一个epoch:400多,慢慢会降到5左右,就在这里徘徊了。按照道理说,应该会降到0和1之间才正常呀,然后我就去打开tensorboard,发现pro_loss,和con_loss都降下去了,但是giou_loss 就一直感觉没变,在那里震荡。giou_loss一开始就在4左右震荡。

StarStar-666 avatar Mar 26 '21 09:03 StarStar-666

损失只是一个方面, 你测试的mAP怎么样呢, 用的分辨率多少.

Byronnar avatar Mar 26 '21 09:03 Byronnar

你的数据应该不能公开, 我不好复现你的问题哎. 不过, 你的数据量1000确实不多, 最好再做一下数据扩增, 然后观察训练集跟验证集损失, 两个都看. 分辨率也多测试一下.

Byronnar avatar Mar 26 '21 10:03 Byronnar

    # with tf.name_scope("define_weight_decay"):  # 指数平滑,可以让算法在最后不那么震荡,结果更有鲁棒性
    #     moving_ave = tf.train.ExponentialMovingAverage(self.moving_ave_decay).apply(tf.trainable_variables()),我把这里关掉了,我需要做和原yolov3对比。是不是由于我注释掉这里的原因?。其实我还有一个问题,大佬。这个代码最后的损失值,能降到1一下把。好像我看你说的,你的损失值,都降到0左右了。

StarStar-666 avatar Mar 26 '21 10:03 StarStar-666

图片大小是416*416的,我没有使用一阶段,直接是二阶段的。

StarStar-666 avatar Mar 26 '21 10:03 StarStar-666

验证集损失最后在7左右收敛了,就不变了。验证集大概是400张

StarStar-666 avatar Mar 26 '21 10:03 StarStar-666

之前训练的模型没有测试,map目前还不知道,现在正在跑代码。

StarStar-666 avatar Mar 26 '21 10:03 StarStar-666

数据能公开,哈哈

StarStar-666 avatar Mar 26 '21 10:03 StarStar-666

我之前 确实损失函数降到了0.几, 但是我那个时候数据量很大, 上万张图片, 指数平滑最好加上, 会稳定一些, 然后最好先看一下mAP, loss不是唯一指标. 416的尺度的话, 你原图多大.

Byronnar avatar Mar 26 '21 10:03 Byronnar

原图就是416大小,加了平滑滤波的话,模型参数是原先的两倍多,我要用模型的参数进行对比。所以,就要去掉。😂,大佬,你训练了多少步呀?------------------ 原始邮件 ------------------ @.> 发送时间: 2021年3月26日(星期五) 晚上6:18 @.>; @.@.>; 主题: Re: [Byronnar/tensorflow-serving-yolov3] giou_loss 不下降! (#103)

StarStar-666 avatar Mar 26 '21 10:03 StarStar-666

我训练了大概100个epoch吧. 这个也得看你数据量的.

Byronnar avatar Mar 26 '21 10:03 Byronnar

难道是我把平均滤波去掉的原因么?😂,整得我都想还原成原先的xy,wh loss了------------------ 原始邮件 ------------------ @.> 发送时间: 2021年3月26日(星期五) 晚上6:31 @.>; @.@.>; 主题: Re: [Byronnar/tensorflow-serving-yolov3] giou_loss 不下降! (#103)

StarStar-666 avatar Mar 26 '21 10:03 StarStar-666

进行对比实验试试先

Byronnar avatar Mar 26 '21 10:03 Byronnar