yolox-pytorch icon indicating copy to clipboard operation
yolox-pytorch copied to clipboard

进行evaluate时候出现问题

Open Xu-feng-feng opened this issue 4 years ago • 8 comments

进行评估的时候运行sh evaluate.sh的时候训练出来的模型出现如下的问题,RuntimeError: Expected all tensors to be on the same device, but found at least two devices, cuda:0 and cpu!

Xu-feng-feng avatar Jul 30 '21 11:07 Xu-feng-feng

拉一下最新代码,这个后处理之前用的cpu,但是预测结果是在gpu上,现在这个已经修复了。https://github.com/zhangming8/yolox-pytorch/blob/main/models/post_process.py#L22-L24

zhangming8 avatar Jul 30 '21 12:07 zhangming8

新的代码在训练设定300个epoch,在284个epoch的时候又出现了**AttributeError: 'MosaicDetection' object has no attribute 'close_mosaic'**这个问题

Xu-feng-feng avatar Aug 06 '21 12:08 Xu-feng-feng

新的代码在训练设定300个epoch,在284个epoch的时候又出现了**AttributeError: 'MosaicDetection' object has no attribute 'close_mosaic'**这个问题

不好意思,修bug的时候这个没注意到,需要把https://github.com/zhangming8/yolox-pytorch/blob/main/train.py#L137 里面的.dataset去掉。 中途断掉可以参考train.sh里面resume接着训练

zhangming8 avatar Aug 06 '21 17:08 zhangming8

好,谢谢,请问下训练集损失下降而验证集到训练到一定的阶段却损失上升是什么原因

Xu-feng-feng avatar Aug 06 '21 18:08 Xu-feng-feng

好,谢谢,请问下训练集损失下降而验证集到训练到一定的阶段却损失上升是什么原因

说明模型在你的数据上逐渐开始过拟合了

zhangming8 avatar Aug 06 '21 22:08 zhangming8

使用amp训练的时候出现RuntimeError: "sigmoid_cpu" not implemented for 'Half'

Xu-feng-feng avatar Aug 07 '21 11:08 Xu-feng-feng

使用amp训练的时候出现RuntimeError: "sigmoid_cpu" not implemented for 'Half'

目前混合精度use_amp=Ture训练我还没push上去,还在验证

zhangming8 avatar Aug 09 '21 02:08 zhangming8

使用amp训练的时候出现RuntimeError: "sigmoid_cpu" not implemented for 'Half'

目前混合精度use_amp=Ture训练我还没push上去,还在验证

目前最新代码已经支持混合精度训练,设置use_amp=True

zhangming8 avatar Aug 10 '21 14:08 zhangming8