PSENet icon indicating copy to clipboard operation
PSENet copied to clipboard

Train Acc 和 Train loss 一起下降

Open luckydog5 opened this issue 6 years ago • 14 comments

Learning Rate Train Loss Train Acc. Train IOU. 0.001000 0.703573 0.692774 0.209862 0.001000 0.670964 0.629873 0.138960 0.001000 0.667703 0.617346 0.126053 0.001000 0.652429 0.631898 0.220572 0.001000 0.621790 0.608643 0.570595 0.001000 0.633929 0.582263 0.558229 0.001000 0.638842 0.575784 0.554956 0.001000 0.646875 0.563551 0.546941

train loss下降,train acc也下降,怀疑是训练样本的问题。不知道是否还有别的原因。

luckydog5 avatar Jun 21 '19 03:06 luckydog5

并且测试的时候,txt文件全是空。。。。。。。

luckydog5 avatar Jun 21 '19 03:06 luckydog5

你是训练哪个数据集?我训练IC,15,基本不收敛,迭代300多步,Loss和Acc没变化。 另外,我的CTW1500数据集训练不了,一直out of memory。 @luckydog5

Tian14267 avatar Jun 21 '19 05:06 Tian14267

icdar 15.

luckydog5 avatar Jun 21 '19 05:06 luckydog5

@Tian14267 数据集是个大问题。。换了一个数据集,网络的表现就正常了。

luckydog5 avatar Jun 21 '19 06:06 luckydog5

你换哪个数据集了?我在CTW1500上跑不了,一直out of memory。 @luckydog5

Tian14267 avatar Jun 21 '19 06:06 Tian14267

@Tian14267 synthtext

luckydog5 avatar Jun 21 '19 07:06 luckydog5

我在 icdar15 + MLT2017 上训练(sgd),75个 epoch 以后,acc 还是不高:

(441/576) Batch: 2.059s | TOTAL: 15min | ETA: 5min | Loss: 0.2540 | Acc_t:  0.8872 | IOU_t:  0.8223 | IOU_k:  0.8405
(461/576) Batch: 2.060s | TOTAL: 16min | ETA: 4min | Loss: 0.2536 | Acc_t:  0.8877 | IOU_t:  0.8218 | IOU_k:  0.8411
(481/576) Batch: 2.063s | TOTAL: 17min | ETA: 3min | Loss: 0.2528 | Acc_t:  0.8879 | IOU_t:  0.8225 | IOU_k:  0.8412
(501/576) Batch: 2.061s | TOTAL: 17min | ETA: 3min | Loss: 0.2526 | Acc_t:  0.8882 | IOU_t:  0.8232 | IOU_k:  0.8414

在 icdar15 的测试集上的结果(scale=1):

Calculated!{"recall": 0.6509388541165142, "precision": 0.7591240875912408, "hmean": 0.7008812856402281, "AP": 0}

0624-update:使用 adam 训练 97 epoch 后结果:

Calculated!{"recall": 0.7053442465093885, "precision": 0.791036717062635, "hmean": 0.7457368287095953, "AP": 0

Sanster avatar Jun 22 '19 04:06 Sanster

@Sanster 我按默认参数训练,600个epoch,hmean: 0.77。 你的训练结果最新进展如何。

ofexe avatar Jun 25 '19 07:06 ofexe

@ofexe 在 icdar15 的训练集上跑 600 个 epoch,scale=4 时 hmean=0.77,scale=1 时 hmean=0.79

Sanster avatar Jun 25 '19 10:06 Sanster

@Sanster 你好你测试的结果是从0开始训练仅训练icdar15的数据集莫,有没有修改过什么参数?我直接用作者的参数训练结果很低,scale=1的结果。 Calculated!{"recall": 0.6942705825710159, "precision": 0.7113961519486927, "hmean": 0.7027290448343079, "AP": 0}

Wangweilai1 avatar Aug 28 '19 10:08 Wangweilai1

@Wangweilai1 加载 ImageNet 的预训练权重,只是用 ic15,用 adam 训的

Sanster avatar Aug 28 '19 10:08 Sanster

@Sanster 好的,谢谢,我一会试试看,你有试过直接用作者的SGD咋样?能训出来作者的结果莫,我测试了一下作者的模型确实是很高,但我怎么训都没有那么高。

Wangweilai1 avatar Aug 28 '19 11:08 Wangweilai1