huihuiustc

Results 4 issues of huihuiustc

从实验精度的结果来看似乎确实没有satrn的精度高,看解码部分也挺像的,使用了传统的CNN网络作为编码部分。中文困难样本依然存在乱出字现象,出的字还是有语义信息的词组。

请问如果想要加入文字信息来辅助训练的话,楼主可以给出一些参考意见吗?我看目前是直接_input_ids放进去的是UNK_TOKEN_ID=3,我可以直接把每一个文本框对应的字符放进去吗?