YOLOv4-pytorch icon indicating copy to clipboard operation
YOLOv4-pytorch copied to clipboard

注意力模块的训练问题

Open sakurasakura1996 opened this issue 4 years ago • 3 comments

你好,我想问一下,如果我想使用加入注意力机制的Yolov4,使用了yolov4的预训练文件,但是注意力模块并没有预训练参数,我可以在加载yolov4预训练文件之后便把这部分参数冻结,然后用自定义数据集只训练注意力模块中参数,训练完成后解除参数冻结,再用自己的数据集训练整个模型,这个操作可行吗?因为在imagenet上预训练这个模型,没有好的GPU资源。。。

sakurasakura1996 avatar Oct 14 '20 03:10 sakurasakura1996

你好,我想问一下,如果我想使用加入注意力机制的Yolov4,使用了yolov4的预训练文件,但是注意力模块并没有预训练参数,我可以在加载yolov4预训练文件之后便把这部分参数冻结,然后用自定义数据集只训练注意力模块中参数,训练完成后解除参数冻结,再用自己的数据集训练整个模型,这个操作可行吗?因为在imagenet上预训练这个模型,没有好的GPU资源。。。

一般来说是先冻结整个backbone的参数,训练其他参数,然后在finetune整个模型。我不清楚你数据集学习的难度,不过你的想法可以试一下。

argusswift avatar Oct 14 '20 06:10 argusswift

你好,我想问一下,如果我想使用加入注意力机制的Yolov4,使用了yolov4的预训练文件,但是注意力模块并没有预训练参数,我可以在加载yolov4预训练文件之后便把这部分参数冻结,然后用自定义数据集只训练注意力模块中参数,训练完成后解除参数冻结,再用自己的数据集训练整个模型,这个操作可行吗?因为在imagenet上预训练这个模型,没有好的GPU资源。。。

一般来说是先冻结整个backbone的参数,训练其他参数,然后在finetune整个模型。我不清楚你数据集学习的难度,不过你的想法可以试一下。

作者您好 可以问您个吗? 为什么我使用了注意力机制 反而比原模型稍微降低了一些,不知道怎么回事。需要注意什么吗?谢谢

joe660 avatar Jan 01 '21 08:01 joe660

你好,我想问一下,如果我想使用加入注意力机制的Yolov4,使用了yolov4的预训练文件,但是注意力模块并没有预训练参数,我可以在加载yolov4预训练文件之后便把这部分参数冻结,然后用自定义数据集只训练注意力模块中参数,训练完成后解除参数冻结,再用自己的数据集训练整个模型,这个操作可行吗?因为在imagenet上预训练这个模型,没有好的GPU资源。。。

如果你加入了注意力机制,原预训练权重就不能再用了。

jcluo1994 avatar Apr 07 '21 15:04 jcluo1994