sdreamforchen

Results 30 comments of sdreamforchen

不知道我说得对不对。 V8这些训练问题,是不是assign的问题,或者说选择回归的loss点太多了(没有处理postive sample 和 negative sample)。造成起始的cls_loss这么大! [07/18 00:44:35] ppdet.engine INFO: Epoch: [0] [ 0/3665] eta: 81 days, 15:43:15 lr: 0.000000 loss: 1312362.750000 loss_cls: 1312202.375000 loss_iou: 160.321213 loss_dfl: 0.000000 loss_l1: 53.665325...

我找找,我应该没有改的,就改了head ---原始邮件--- 发件人: "Feng ***@***.***> 发送时间: 2023年7月18日(周二) 中午12:47 收件人: ***@***.***>; 抄送: ***@***.******@***.***>; 主题: Re: [PaddlePaddle/PaddleYOLO] YOLOv8m训练自己的数据集,几个epoch后loss变0。3090ti,单卡,调整了学习率,取消了mosaic增强。 (Issue #166) 这个起始loss_cls这么大明显是初始化的问题,你是改了初始化的相关代码吗。先按coco数据集训下看正常的情况,自定义数据集如果训的不正常,应该先排查数据集制作的问题。 — Reply to this email directly, view it on GitHub, or...

> 这个起始loss_cls这么大明显是初始化的问题,你是改了初始化的相关代码吗。先按coco数据集训下看正常的情况,自定义数据集如果训的不正常,应该先排查数据集制作的问题。 未更改初始化,而且在训练前还重新拉取的最新代码。 仅将forward_train\forward_eval\get_loss代码进行了修改

我将ppyoloe的head的DFL去掉,训练正常; 将paddleYOLO的v8的backbone和neck拷贝到paddledetection里,用ppyoloe的head,loss正常,和ppyoloe的差不多。但是40epoch,精度还是为0.

分享一个我的解决方案,不用paddleyolo,讲yolov8那几个Python文件放到对应的paddledetection里面去,你参考ppyoloe,这样是没问题的,保险一点就是所以的除了head按照以上操作,改ppyoloe的head,也可以不改,因为head不是这俩模型的主要差别,我目前就是这么玩通的。 不改head是因为里面涉及标签分配,loss计算等一大堆内容,这样又可能一堆小问题出现。 ps:fpn输出这俩模型不一样,一个是4 3 2,另一个是2 3 4,顺序是反着的,这地方需要修改一下。 ---原始邮件--- 发件人: ***@***.***> 发送时间: 2023年9月7日(周四) 下午2:51 收件人: ***@***.***>; 抄送: ***@***.******@***.***>; 主题: Re: [PaddlePaddle/PaddleYOLO] YOLOv8m训练自己的数据集,几个epoch后loss变0。3090ti,单卡,调整了学习率,取消了mosaic增强。 (Issue #166) 我用yolov8s也出现同样的问题,从11epoch开始,loss为0 而且前面10epoch后eval全为0,加载了coco权重做预训练,用的是aistudio上的A100资源 hi~,我也遇到了同样的问题,训练自己的数据集,加载了预训练权重,使用bs=16单卡训练,在第3个epochloss变0,跟你发出来的情况几乎一样。请问最后有解决办法嘛 — Reply to this...

应该问题不大。你就迁移backbone和fpn的嘛,没啥特别的操作。 ---原始邮件--- 发件人: ***@***.***> 发送时间: 2023年9月7日(周四) 下午3:16 收件人: ***@***.***>; 抄送: ***@***.******@***.***>; 主题: Re: [PaddlePaddle/PaddleYOLO] YOLOv8m训练自己的数据集,几个epoch后loss变0。3090ti,单卡,调整了学习率,取消了mosaic增强。 (Issue #166) 大佬可以交流一下嘛,PPYOLO要求paddle2.4以上,我目前用的ppdetection是2.3,这个可以直接把代码迁移过去嘛 — Reply to this email directly, view it on GitHub, or unsubscribe....

> 我也不太清楚你这个是什么问题,可以参考一下我在paddledetection上提的issue,目前已经能够跑通ppyoloe。[https://github.com/PaddlePaddle/PaddleDetection/issues/5544](url) 那你在服务器端会报我这两个警告吗

> @ds2268 thanks for your verification. So it should be LAMB or BCE causing the problem. > > Currently I don't have enough GPU or time to debug more, you...