FOTS
FOTS copied to clipboard
FOTS中文数据训练实践
1、首先将LSTM隐藏层数设置为256(1024的话,参数量会很夸张)。 2、检查训练图像预处理是否与自己的数据兼容。 3、先训练识别网络,得到骨干网及识别分枝的预训练模型。 4、更改网络结构,使检测和识别使用同一个骨干网,再利用3步的预训练模型进行联合训练。 5、EAST检测分枝,由于算法自身的限制,无法处理好长文本。如果想改善,可以把检测分枝更换为其他能够处理长文本的检测模型。
如果有中文端到端的问题,可以在这里进行讨论。
@ivoxx 谢了~ 另外群的话,可以加qq群:785515057(已满)826714963。也可以加微信nsnovio,拉你进微信群
您好,关于中文识别,能看一下您的common_str.py怎么设置的吗?
@471417367 就是常见的汉字.
@ivoxx 你好,你输入crnn部分的中文识别高度为多少? img_h参数
@ivoxx 你好,你输入crnn部分的中文识别高度为多少? img_h参数 16
@ivoxx 多谢回复。 近期训练中文发现有些问题,可以方便分享一下你的config文件的设置吗?
@WeihongM lstm通道数设为256 , 其他config参数基本没变
谢谢你的建议,对于中文来说,预训练真的很重要
@ivoxx 你好,我想问一下第三步应该怎么做呢?骨干网是指RESNET吗?是在哪个数据集上进行预训练呢?
@ivoxx 你好,我想问一下第三步应该怎么做呢?骨干网是指RESNET吗?是在哪个数据集上进行预训练呢?
@GaroneHuang 把检测分支屏蔽掉训练骨干网,骨干网可以是RESNET,我使用的是自己合成的中文数据
@ivoxx 您好,请问您能share一下您在中文数据集中预训练模型的权重吗,感谢
hi 训练这个模型有问题,有人可以帮我解答嘛
请问在一个中英文的场景中,应该用什么预训练模型,后续用什么中英数据集优化? 谢谢