SwinTextSpotter icon indicating copy to clipboard operation
SwinTextSpotter copied to clipboard

Pytorch re-implementation of Paper: SwinTextSpotter: Scene Text Spotting via Better Synergy between Text Detection and Text Recognition (CVPR 2022)

Results 56 SwinTextSpotter issues
Sort by recently updated
recently updated
newest added

请问,我在使用您已经训练好的模型进行测试的时候,发现它只能识别英文或者中文。如果我想识别英文,中文以及数字和一些字符都在一张图片上的照片应该做哪些修改才能实现

How can I find the model called "swin_imagenet_pretrain.pth" in SWINTS-swin-pretrain.yaml? I'm a beginner, So I don't know how to find that file. I just want to run pretrained SWINTS codes.....

TRAIN: ("totaltext_train","icdar_2015_train","icdar_2013_train","icdar_2017_validation_mlt","icdar_2017_mlt","icdar_curvesynthtext_train1","icdar_curvesynthtext_train2",) [我从ICDAR2017-MLT](https://rrc.cvc.uab.es/?ch=8&com=downloads)下载了全部数据集,但是icdar_2017_validation_mlt文件夹中并没有json文件,另外icdar_curvesynthtext_train1","icdar_curvesynthtext_train2里面只有txt文件,请问我改如何生成.json文件,有参考示例吗

ReCTS数据集如何进行evaluation? 找不到ground truth.

作者您好, 我想使用自己的数据集微调模型,并复现代码。 预训练的模型生成结果都很正常,但是微调之后的mask就变得很奇怪,感觉坐标完全不对。我不知是不是数据处理过程出了问题。您可以帮我分析一下可能的原因吗? 此外,我刚入门深度学习,学的还不是很明白,为什么这里坐标1,2被跳过了,而使用的是3和7,能请您给我解答一下吗? 十分感谢!

1.SwinTextSpotter-main\projects\SWINTS\swints\config.py (里面,主要定义了这个add_SWINTS_config函数,我看训练和测试都用了,应该是模型的一些超参数设置吧?) 2.第1问题的config.py里面有一个cfg.MODEL.SWINTS.PATH_COMPONENTS="./projects/SWINTS/LME/coco_2017_train_class_agnosticTrue_whitenTrue_sigmoidTrue_60_siz28.npz" (这个具体是什么作用呢?) 3.demo.py中cfg.merge_from_file(args.config_file)把projects/SWINTS/configs/SWINTS-swin-finetune-totaltext.yaml加入了cfg(这个SWINTS-swin-finetune-totaltext.yaml是什么作用呢) 4..demo.py中cfg.merge_from_list(args.opts)把./output/tt_model_final.pth加入cfg(这个意思是不是覆盖了第3个问题中的SWINTS-swin-finetune-totaltext.yaml中初始化的 MODEL.WEIGHTS,所以./output/tt_model_final.pth又是什么作用呢)

您好 我评估rects模型的时候,以下两个参数都是零,这是因为什么呢?(如果可以的话可以加一下您的联系方式吗?) [05/24 10:25:50 d2.evaluation.testing]: copypaste: Task: DETECTION_ONLY_RESULTS[05/24 10:25:50 d2.evaluation.testing]: copypaste: precision,recall,hmean[05/24 10:25:50 d2.evaluation.testing]: copypaste: 0.7778,0.0032,0.0063 [05/24 10:25:50 d2.evaluation.testing]: copypaste: Task: None-E2E_RESULTS [05/24 10:25:50 d2.evaluation.testing]:copypaste: precision,recall,hmean [05/24 10:25:50 d2.evaluation.testing]:copypaste:0.0000,0.0000, 0.0000...

![image](https://user-images.githubusercontent.com/61306120/228262863-eb2a9a07-466c-4a30-ba95-fbb2e1388b78.png) 请问模型的训练是否对batchSize、imageSize、boundingbox等有要求。 SWINTS-swin-chn_pretrain.yaml : > _BASE_: "Base-SWINTS_swin.yaml" MODEL: WEIGHTS: "swin_imagenet_pretrain.pth" SWINTS: NUM_PROPOSALS: 300 NUM_CLASSES: 2 REC_HEAD: POOLER_RESOLUTION: (16,48) RESOLUTION: (32, 80) BATCH_SIZE: 16 NUM_CLASSES: 5463 DATASETS: TRAIN: ("totaltext_train",) TEST: ("totaltext_test",)...