CRAFT-Reimplementation
CRAFT-Reimplementation copied to clipboard
关于训练
非常感谢你公开你的代码,看了您的实现,我有几个问题请教。
1.我看到您提供的预训练模型有用ic13+ic17训练的,但是我去看了这两个数据集的标注,ic13的gt是四个数字,ic17是8个数字,但是这两个数据集在数据加载的时候都是通过一个函数加载的。他们读gt坐标的时候不产生冲突吗?
2.craft该方法是可以识别任意形状的文字框,我看您使用ic13,ic15,ic17,SynthText等数据集训练的,这些文字没有那种曲形(例如星巴克),但是训练出来模型也能识别这些形状的。能给个解释吗?
3.如果我想训练total_text数据集,这个代码能直接像ic15那样拿来训练吗?或者是我想加强模型对任意形状文字的检测能力,我该如何训练呢?
期待您的回复,谢谢。
question+1