PaddleOCR
PaddleOCR copied to clipboard
自动关系抽取(relation extration)
通过预定义文件(docvqa_predefine.py)为Label.txt 增加关系抽取(RE),直观地就是增加id、linking属性,并修改key_cls为question、answer或other。以PPLabelOCRLabel V3的Label.txt新格式要求实现RE( 移除xfund格式、移除切分文本)。
Thanks for your contribution!
PaddleOCR社区常规赛 #4982 project : 《巧用PPOCRLabel制作DOC-VQA格式数据集》
期待PPOCRLabel支持自动切割文本和RE关联。 ~~