YOLOv4-pytorch 注意力模块的训练问题

你好，我想问一下，如果我想使用加入注意力机制的Yolov4，使用了yolov4的预训练文件，但是注意力模块并没有预训练参数，我可以在加载yolov4预训练文件之后便把这部分参数冻结，然后用自定义数据集只训练注意力模块中参数，训练完成后解除参数冻结，再用自己的数据集训练整个模型，这个操作可行吗？因为在imagenet上预训练这个模型，没有好的GPU资源。。。

Oct 14 '20 03:10 sakurasakura1996

你好，我想问一下，如果我想使用加入注意力机制的Yolov4，使用了yolov4的预训练文件，但是注意力模块并没有预训练参数，我可以在加载yolov4预训练文件之后便把这部分参数冻结，然后用自定义数据集只训练注意力模块中参数，训练完成后解除参数冻结，再用自己的数据集训练整个模型，这个操作可行吗？因为在imagenet上预训练这个模型，没有好的GPU资源。。。

一般来说是先冻结整个backbone的参数，训练其他参数，然后在finetune整个模型。我不清楚你数据集学习的难度，不过你的想法可以试一下。

Oct 14 '20 06:10 argusswift

你好，我想问一下，如果我想使用加入注意力机制的Yolov4，使用了yolov4的预训练文件，但是注意力模块并没有预训练参数，我可以在加载yolov4预训练文件之后便把这部分参数冻结，然后用自定义数据集只训练注意力模块中参数，训练完成后解除参数冻结，再用自己的数据集训练整个模型，这个操作可行吗？因为在imagenet上预训练这个模型，没有好的GPU资源。。。

一般来说是先冻结整个backbone的参数，训练其他参数，然后在finetune整个模型。我不清楚你数据集学习的难度，不过你的想法可以试一下。

作者您好可以问您个吗？为什么我使用了注意力机制反而比原模型稍微降低了一些，不知道怎么回事。需要注意什么吗？谢谢

Jan 01 '21 08:01 joe660

你好，我想问一下，如果我想使用加入注意力机制的Yolov4，使用了yolov4的预训练文件，但是注意力模块并没有预训练参数，我可以在加载yolov4预训练文件之后便把这部分参数冻结，然后用自定义数据集只训练注意力模块中参数，训练完成后解除参数冻结，再用自己的数据集训练整个模型，这个操作可行吗？因为在imagenet上预训练这个模型，没有好的GPU资源。。。

如果你加入了注意力机制，原预训练权重就不能再用了。

Apr 07 '21 15:04 jcluo1994

YOLOv4-pytorch YOLOv4-pytorch copied to clipboard

注意力模块的训练问题

YOLOv4-pytorch
YOLOv4-pytorch copied to clipboard