FOTS
FOTS copied to clipboard

Published 20 hours ago •

Reame
Issues

FOTS中文数据训练实践

Open ivoxx opened this issue 5 years ago • 13 comments

1、首先将LSTM隐藏层数设置为256（1024的话，参数量会很夸张）。 2、检查训练图像预处理是否与自己的数据兼容。 3、先训练识别网络，得到骨干网及识别分枝的预训练模型。 4、更改网络结构，使检测和识别使用同一个骨干网，再利用3步的预训练模型进行联合训练。 5、EAST检测分枝，由于算法自身的限制，无法处理好长文本。如果想改善，可以把检测分枝更换为其他能够处理长文本的检测模型。

如果有中文端到端的问题，可以在这里进行讨论。

Dec 28 '19 00:12 ivoxx

@ivoxx 谢了~ 另外群的话，可以加qq群：785515057（已满）826714963。也可以加微信nsnovio，拉你进微信群

Dec 30 '19 02:12 novioleo

您好，关于中文识别，能看一下您的common_str.py怎么设置的吗？

Mar 18 '20 10:03 471417367

@471417367 就是常见的汉字.

Mar 18 '20 13:03 novioleo

@ivoxx 你好，你输入crnn部分的中文识别高度为多少? img_h参数

Aug 02 '20 06:08 WeihongM

@ivoxx 你好，你输入crnn部分的中文识别高度为多少? img_h参数 16

Aug 03 '20 07:08 ivoxx

@ivoxx 多谢回复。近期训练中文发现有些问题，可以方便分享一下你的config文件的设置吗？

Aug 03 '20 07:08 WeihongM

@WeihongM lstm通道数设为256 , 其他config参数基本没变

Aug 04 '20 07:08 ivoxx

谢谢你的建议，对于中文来说，预训练真的很重要

Aug 04 '20 14:08 WeihongM

@ivoxx 你好，我想问一下第三步应该怎么做呢？骨干网是指RESNET吗？是在哪个数据集上进行预训练呢？

Oct 06 '20 11:10 GaroneHuang

@ivoxx 你好，我想问一下第三步应该怎么做呢？骨干网是指RESNET吗？是在哪个数据集上进行预训练呢？

@GaroneHuang 把检测分支屏蔽掉训练骨干网，骨干网可以是RESNET，我使用的是自己合成的中文数据

Oct 09 '20 03:10 ivoxx

@ivoxx 您好，请问您能share一下您在中文数据集中预训练模型的权重吗，感谢

Oct 09 '20 05:10 GaroneHuang

hi 训练这个模型有问题，有人可以帮我解答嘛

Oct 29 '21 11:10 paleblackless

请问在一个中英文的场景中,应该用什么预训练模型,后续用什么中英数据集优化? 谢谢

Jan 10 '22 08:01 laofeiwei