Xudong Xie
Xudong Xie
In the paper, we only use two synthetic datasets for training, and the proposed WordArt dataset (testing set) is just used for evaluation.
Thanks! The code has implemented the "self-attention + cross-attention" module in corner_crossattn_layers.py: https://github.com/xdxie/WordArt/blob/cc1dae78ed924dae2ab8b4001edbc483f9caae4c/mmocr/models/textrecog/layers/corner_crossattn_layers.py#L38 I'm sorry that the naming of this module gave you a misunderstanding.
您好,我们目前并没有在中文艺术字上实验,也没有构建中文艺术字识别的数据集,但是十分欢迎您基于这项工作进一步探索中文艺术字识别任务!其实引入角点的初衷就是为了提供复杂字形的先验,所以应该也会对中文艺术字以及手写字这样的复杂字形有一定帮助,即便不使用cross attention进行融合。另外,中文字符类别多,汉字变化复杂,需要探索其他比角点更高效的形状先验,甚至还要考虑该汉字的语义信息,比如在很多中文艺术字设计的时候借鉴了象形字、会意字、指事字等很多特点。当然,中文艺术文本行的识别还存在更多的连笔与不规则字符排列等等,都是很值得研究的挑战问题。