models icon indicating copy to clipboard operation
models copied to clipboard

度量学习项目难以收敛

Open Fighter-zzp opened this issue 4 years ago • 7 comments

近日,我测试用了models的度量学习(metric_learning)项目,但是数据我替换成了人脸数据,其他代码在基本未改的情况下,我训练项目时的loss非常大,recall仍旧很小。请问一下我在这里需要调整什么代码吗,还是参数需要调一下,怎么才能让它快速收敛?

我微调训练(batch size为50,其他基本不变)其了几万轮,loss还是很大如下 [2020-04-22 17:51:47] trainbatch 30000, lr 0.000100, loss 0.983684, recall 0.1835, time 0.22 sec

Fighter-zzp avatar Apr 22 '20 09:04 Fighter-zzp

你是用的已有的模型进行微调么

MyPandaShaoxiang avatar Apr 23 '20 03:04 MyPandaShaoxiang

你是用的已有的模型进行微调么

是的

Fighter-zzp avatar Apr 23 '20 03:04 Fighter-zzp

已有的model是从哪里来的

MyPandaShaoxiang avatar Apr 23 '20 03:04 MyPandaShaoxiang

已有的model是从哪里来的

我用的模型都是度量学习源码的模型,没有怎么改变哦

Fighter-zzp avatar Apr 24 '20 08:04 Fighter-zzp

近日,我测试用了models的度量学习(metric_learning)项目,但是数据我替换成了人脸数据,其他代码在基本未改的情况下,我训练项目时的loss非常大,recall仍旧很小。请问一下我在这里需要调整什么代码吗,还是参数需要调一下,怎么才能让它快速收敛?

我微调训练(batch size为50,其他基本不变)其了几万轮,loss还是很大如下 [2020-04-22 17:51:47] trainbatch 30000, lr 0.000100, loss 0.983684, recall 0.1835, time 0.22 sec

1.确认下预训练模型是否加载正确 2.确认下人脸数据集的规模,用的哪个loss,学习率是否比较小

cuicheng01 avatar Apr 27 '20 05:04 cuicheng01

近日,我测试用了models的度量学习(metric_learning)项目,但是数据我替换成了人脸数据,其他代码在基本未改的情况下,我训练项目时的loss非常大,recall仍旧很小。请问一下我在这里需要调整什么代码吗,还是参数需要调一下,怎么才能让它快速收敛?

我微调训练(batch size为50,其他基本不变)其了几万轮,loss还是很大如下 [2020-04-22 17:51:47] trainbatch 30000, lr 0.000100, loss 0.983684, recall 0.1835, time 0.22 sec

1.确认下预训练模型是否加载正确 2.确认下人脸数据集的规模,用的哪个loss,学习率是否比较小

预训练模式是之前训练的arcmargin,人脸数据为celebA的5000分类,loss为eml,学习率为0.001

Fighter-zzp avatar Apr 27 '20 15:04 Fighter-zzp

近日,我测试用了models的度量学习(metric_learning)项目,但是数据我替换成了人脸数据,其他代码在基本未改的情况下,我训练项目时的loss非常大,recall仍旧很小。请问一下我在这里需要调整什么代码吗,还是参数需要调一下,怎么才能让它快速收敛?

我微调训练(batch size为50,其他基本不变)其了几万轮,loss还是很大如下 [2020-04-22 17:51:47] trainbatch 30000, lr 0.000100, loss 0.983684, recall 0.1835, time 0.22 sec

1.确认下预训练模型是否加载正确 2.确认下人脸数据集的规模,用的哪个loss,学习率是否比较小

预训练模式是之前训练的arcmargin,人脸数据为celebA的5000分类,loss为eml,学习率为0.001

你现在训练好人脸了吗,我这儿调用两张图片,非常不相关的两张图片,用代码那个欧式距离计算出来的是0

xiaoran-xr avatar Sep 24 '20 09:09 xiaoran-xr