PaddleOCR icon indicating copy to clipboard operation
PaddleOCR copied to clipboard

SVTR模型训练超参数设置问题

Open willpat1213 opened this issue 2 years ago • 10 comments

我希望能够对齐论文精度,如果使用DDP的训练方式,在八卡的情况下,相关参数例如batchsize和lr应该怎么给呢?

willpat1213 avatar Sep 19 '22 11:09 willpat1213

svtr-tiny训练时单卡batchsize为512,使用4卡,lr为0.0005,如果要更改batchsize,lr随着batchsize线性改变即可,例如,单卡batchsize为256,使用4卡,lr则需改为0.00025。 small base large同理。

Topdu avatar Sep 20 '22 07:09 Topdu

想问一下就是按照他的相关参数训练的话,4个卡tiny需要训练多久?数据集就用他给的那个街景的数据集

yulm-1 avatar Sep 21 '22 07:09 yulm-1

训练集指的那两个合成数据集吗,四张a100需要一天多

willpat1213 avatar Sep 21 '22 07:09 willpat1213

训练集指的那两个合成数据集吗,四张a100需要一天多

不是合成数据集是[Chinese Benckmark]那个数据集

yulm-1 avatar Sep 21 '22 07:09 yulm-1

那个是作为测试集吧,训练还是合成的

willpat1213 avatar Sep 21 '22 07:09 willpat1213

https://github.com/PaddlePaddle/PaddleOCR/blob/release/2.6/doc/doc_ch/algorithm_rec_svtr.md 中的 image 他没有提供合成数据集呀

那个是作为测试集吧,训练还是合成的

yulm-1 avatar Sep 21 '22 07:09 yulm-1

这里都是测试集,训练集都是syth和mj,论文中有提到

willpat1213 avatar Sep 21 '22 07:09 willpat1213

这里都是测试集,训练集都是syth和mj,论文中有提到

好的,非常感谢

yulm-1 avatar Sep 21 '22 07:09 yulm-1

这里都是测试集,训练集都是syth和mj,论文中有提到

请问你有这两个数据集吗?

yulm-1 avatar Sep 21 '22 08:09 yulm-1

image 我又认真的看了一下这个论文,他应该就是用[Chinese Benckmark]提的数据集进行中文任务的训练,英文的训练用的是syth和mj这两个数据集

yulm-1 avatar Sep 21 '22 08:09 yulm-1