FOTS icon indicating copy to clipboard operation
FOTS copied to clipboard

FOTS中文数据训练实践

Open ivoxx opened this issue 5 years ago • 13 comments

1、首先将LSTM隐藏层数设置为256(1024的话,参数量会很夸张)。 2、检查训练图像预处理是否与自己的数据兼容。 3、先训练识别网络,得到骨干网及识别分枝的预训练模型。 4、更改网络结构,使检测和识别使用同一个骨干网,再利用3步的预训练模型进行联合训练。 5、EAST检测分枝,由于算法自身的限制,无法处理好长文本。如果想改善,可以把检测分枝更换为其他能够处理长文本的检测模型。

如果有中文端到端的问题,可以在这里进行讨论。

ivoxx avatar Dec 28 '19 00:12 ivoxx

@ivoxx 谢了~ 另外群的话,可以加qq群:785515057(已满)826714963。也可以加微信nsnovio,拉你进微信群

novioleo avatar Dec 30 '19 02:12 novioleo

您好,关于中文识别,能看一下您的common_str.py怎么设置的吗?

471417367 avatar Mar 18 '20 10:03 471417367

@471417367 就是常见的汉字.

novioleo avatar Mar 18 '20 13:03 novioleo

@ivoxx 你好,你输入crnn部分的中文识别高度为多少? img_h参数

WeihongM avatar Aug 02 '20 06:08 WeihongM

@ivoxx 你好,你输入crnn部分的中文识别高度为多少? img_h参数 16

ivoxx avatar Aug 03 '20 07:08 ivoxx

@ivoxx 多谢回复。 近期训练中文发现有些问题,可以方便分享一下你的config文件的设置吗?

WeihongM avatar Aug 03 '20 07:08 WeihongM

@WeihongM lstm通道数设为256 , 其他config参数基本没变

ivoxx avatar Aug 04 '20 07:08 ivoxx

谢谢你的建议,对于中文来说,预训练真的很重要

WeihongM avatar Aug 04 '20 14:08 WeihongM

@ivoxx 你好,我想问一下第三步应该怎么做呢?骨干网是指RESNET吗?是在哪个数据集上进行预训练呢?

GaroneHuang avatar Oct 06 '20 11:10 GaroneHuang

@ivoxx 你好,我想问一下第三步应该怎么做呢?骨干网是指RESNET吗?是在哪个数据集上进行预训练呢?

@GaroneHuang 把检测分支屏蔽掉训练骨干网,骨干网可以是RESNET,我使用的是自己合成的中文数据

ivoxx avatar Oct 09 '20 03:10 ivoxx

@ivoxx 您好,请问您能share一下您在中文数据集中预训练模型的权重吗,感谢

GaroneHuang avatar Oct 09 '20 05:10 GaroneHuang

hi 训练这个模型有问题,有人可以帮我解答嘛

paleblackless avatar Oct 29 '21 11:10 paleblackless

请问在一个中英文的场景中,应该用什么预训练模型,后续用什么中英数据集优化? 谢谢

laofeiwei avatar Jan 10 '22 08:01 laofeiwei