models
models copied to clipboard
度量学习test的时候卡住不动了
度量学习官方例子
运行到26000次的时候,在测试集的时候就卡住不动了,也不报错
强制停止的时候发现卡在这里了

感谢您的反馈,请问“度量学习官方例子”可以给一个具体链接么?
机器 GPU: 1080 11G 内存:16g ubuntu: 16.04
官方例子 https://www.paddlepaddle.org.cn/modelbasedetail/metriclearning
用的这个命令
python train_elem.py
--model=ResNet50
--train_batch_size=64
--test_batch_size=50
--lr=0.01
--total_iter_num=30000
--use_gpu=True
--pretrained_model=ResNet50_pretrained
--model_save_dir=output
--loss_name=arcmargin
--arc_scale=80.0 \
--arc_margin=0.15
--arc_easy_margin=False
@wengooooo 这个不是卡住了,是因为测试集比较大,计算比较耗时;5~10分钟是要的
@Intsigstephon 我都4小时不动了
@wengooooo 你好,请问26000次迭代之前有跑出过test_recall的结果吗? 正常会有在测试集上的test_recall的结果。从你反馈的结果看,应该就是在做evaluation的时候卡住了;这个例子我之前跑过,能跑通;我把参数稍微改了下, scale改为30,不过我的batch_size为128;30000次迭代后出来的metric比官方给的还高一点呢,哈哈
@wengooooo 你好,请问你这个问题解决了吗,我也遇到你的这个问题了