mxin262
mxin262
Hi, you can increase the batch size and train more iterations. Besides, you can train the model based on our pre-training model.
从这个[链接](https://drive.google.com/file/d/1Yx3GRRUogjYYDUrprexGnPerFX3H6r_3/view)下载,生成json文件可以参考[这里](https://drive.google.com/file/d/1FE17GXyGPhDk5XI3EpbXwlOv1S8txOx2/view)
这个数据集需要上传到官网进行评估,它没有测试集的GT
使用ReCTS上训练的模型应该可以同时识别英文和中文
Total-Text和ReCTS识别的码表不同
可以参考[这个脚本](https://drive.google.com/file/d/1FE17GXyGPhDk5XI3EpbXwlOv1S8txOx2/view)处理好数据集
可以尝试需要限制一下gt中的最大数量或者增大queries的数量,目前的默认配置只有300个queries
IMS_PER_BATCH就是每个batch里面图片的数量,REC_HEAD下面的BATCH_SIZE是识别的BATCH_SIZE
1)中文的类别更多,识别分辨率更大了,所以占用显存更多; 2)这是因为最大的文本数量限制了只能300个,调整识别头BATCH_SIZE之后,出现这个报错是因为图片中没有文本实例,可以继续训练的, 3)可以试试把文件先下载好,根据readme来评测
根据你的显存来设置就好了