Genshin_Datasets
Genshin_Datasets copied to clipboard
请问标注中半结构化数据如何处理?
你好,请教一下,数据的文本标注 .lab文件中,包含大量半结构化数据,比如{NICKNAME}, {RUBY_B#} {F#} ,这些都有哪些标记?分别怎么处理呢? 有没有相关工具?
你好,请教一下,数据的文本标注 .lab文件中,包含大量半结构化数据,比如{NICKNAME}, {RUBY_B#} {F#} ,这些都有哪些标记?分别怎么处理呢? 有没有相关工具?
这种我实际训练时候直接扔了
感谢帮助,目前我发现的主要是圈在大括号里的 {}, 有没有发现其他的半结构模式呢? 我做正则的时候可以参考一下,谢谢!