SwinTextSpotter issues

作者你好，初学者想询问一个问题

3

请问，我在使用您已经训练好的模型进行测试的时候，发现它只能识别英文或者中文。如果我想识别英文，中文以及数字和一些字符都在一张图片上的照片应该做哪些修改才能实现

Hi, I have a little question.

1

How can I find the model called "swin_imagenet_pretrain.pth" in SWINTS-swin-pretrain.yaml? I'm a beginner, So I don't know how to find that file. I just want to run pretrained SWINTS codes.....

architectyou

作者你好，官网提供的icdar_2017_validation_mlt没有json文件，改怎么处理

1

TRAIN: ("totaltext_train","icdar_2015_train","icdar_2013_train","icdar_2017_validation_mlt","icdar_2017_mlt","icdar_curvesynthtext_train1","icdar_curvesynthtext_train2",) [我从ICDAR2017-MLT](https://rrc.cvc.uab.es/?ch=8&com=downloads)下载了全部数据集，但是icdar_2017_validation_mlt文件夹中并没有json文件，另外icdar_curvesynthtext_train1","icdar_curvesynthtext_train2里面只有txt文件，请问我改如何生成.json文件，有参考示例吗

256-7421142

mmocr 啥时候会收录SwinTextSpotter

1

256-7421142

ReCTS

3

ReCTS数据集如何进行evaluation? 找不到ground truth.

Fwwwwww111

作者你好，请问项目的demo测试中从哪里获得识别出的文本内容

1

shaoping1t

预训练的模型生成mask结果正常，微调（fine-tuning）之后结果就变得很差

1

作者您好，我想使用自己的数据集微调模型，并复现代码。预训练的模型生成结果都很正常，但是微调之后的mask就变得很奇怪，感觉坐标完全不对。我不知是不是数据处理过程出了问题。您可以帮我分析一下可能的原因吗？此外，我刚入门深度学习，学的还不是很明白，为什么这里坐标1，2被跳过了，而使用的是3和7，能请您给我解答一下吗？十分感谢！

Cen-Lu

作者，您好，初学者想问一下这几个文件的作用。

1

1.SwinTextSpotter-main\projects\SWINTS\swints\config.py (里面，主要定义了这个add_SWINTS_config函数，我看训练和测试都用了，应该是模型的一些超参数设置吧？) 2.第1问题的config.py里面有一个cfg.MODEL.SWINTS.PATH_COMPONENTS="./projects/SWINTS/LME/coco_2017_train_class_agnosticTrue_whitenTrue_sigmoidTrue_60_siz28.npz" （这个具体是什么作用呢？） 3.demo.py中cfg.merge_from_file(args.config_file)把projects/SWINTS/configs/SWINTS-swin-finetune-totaltext.yaml加入了cfg（这个SWINTS-swin-finetune-totaltext.yaml是什么作用呢） 4..demo.py中cfg.merge_from_list(args.opts)把./output/tt_model_final.pth加入cfg（这个意思是不是覆盖了第3个问题中的SWINTS-swin-finetune-totaltext.yaml中初始化的 MODEL.WEIGHTS，所以./output/tt_model_final.pth又是什么作用呢）

CVerSMH

作者，您好，打扰一下初学者想问一些问题

2

您好我评估rects模型的时候，以下两个参数都是零，这是因为什么呢？（如果可以的话可以加一下您的联系方式吗？） [05/24 10:25:50 d2.evaluation.testing]: copypaste: Task: DETECTION_ONLY_RESULTS[05/24 10:25:50 d2.evaluation.testing]: copypaste: precision,recall,hmean[05/24 10:25:50 d2.evaluation.testing]: copypaste: 0.7778,0.0032,0.0063 [05/24 10:25:50 d2.evaluation.testing]: copypaste: Task: None-E2E_RESULTS [05/24 10:25:50 d2.evaluation.testing]:copypaste: precision,recall,hmean [05/24 10:25:50 d2.evaluation.testing]:copypaste:0.0000,0.0000, 0.0000...

xiaoxiaoxiao99

训练中途报错RuntimeError: The size of tensor a (300) must match the size of tensor b (553) at non-singleton dimension 0

3

![image](https://user-images.githubusercontent.com/61306120/228262863-eb2a9a07-466c-4a30-ba95-fbb2e1388b78.png) 请问模型的训练是否对batchSize、imageSize、boundingbox等有要求。 SWINTS-swin-chn_pretrain.yaml ： > _BASE_: "Base-SWINTS_swin.yaml" MODEL: WEIGHTS: "swin_imagenet_pretrain.pth" SWINTS: NUM_PROPOSALS: 300 NUM_CLASSES: 2 REC_HEAD: POOLER_RESOLUTION: (16,48) RESOLUTION: (32, 80) BATCH_SIZE: 16 NUM_CLASSES: 5463 DATASETS: TRAIN: ("totaltext_train",) TEST: ("totaltext_test",)...

che525538919

SwinTextSpotter
SwinTextSpotter copied to clipboard

Metadata

作者你好，初学者想询问一个问题

Hi, I have a little question.

作者你好，官网提供的icdar_2017_validation_mlt没有json文件，改怎么处理

mmocr 啥时候会收录SwinTextSpotter

ReCTS

作者你好，请问项目的demo测试中从哪里获得识别出的文本内容

预训练的模型生成mask结果正常，微调（fine-tuning）之后结果就变得很差

作者，您好，初学者想问一下这几个文件的作用。

作者，您好，打扰一下初学者想问一些问题

训练中途报错RuntimeError: The size of tensor a (300) must match the size of tensor b (553) at non-singleton dimension 0

← Metadata

Owner

Metadata

SwinTextSpotter SwinTextSpotter copied to clipboard

Metadata

← Metadata

Owner

Metadata

SwinTextSpotter
SwinTextSpotter copied to clipboard