PaddleNLP
PaddleNLP copied to clipboard
Add ERNIE-LayoutX
PR types
New features
PR changes
Models
Description
- Add ERNIE-LayoutX-Base
from paddlenlp.transformers import *
ernie_layoutx = AutoModel.from_pretrained("ernie-layoutx-base-uncased")
tokenizer = AutoTokenizer.from_pretrained("ernie-layoutx-base-uncased")
-
Add benchmark
-
开源数据集介绍
数据集 任务类型 语言 FUNSD 文档信息抽取 英文 XFUND-ZH 文档信息抽取 中文 DocVQA-ZH 文档视觉问答 中文 RVL-CDIP 文档图像分类 英文 -
评测结果
在文档智能领域主流开源数据集的验证集上评测指标如下表所示:
Model FUNSD RVL-CDIP (sampled) XFUND-ZH DocVQA-ZH LayoutXLM-Base 86.72 89.65 86.24 ERNIE-LayoutX-Base 89.31 90.13 88.58 69.86 -