PaddleNLP icon indicating copy to clipboard operation
PaddleNLP copied to clipboard

Add ERNIE-LayoutX

Open linjieccc opened this issue 3 years ago • 0 comments

PR types

New features

PR changes

Models

Description

  • Add ERNIE-LayoutX-Base
from paddlenlp.transformers import *

ernie_layoutx = AutoModel.from_pretrained("ernie-layoutx-base-uncased")
tokenizer = AutoTokenizer.from_pretrained("ernie-layoutx-base-uncased")
  • Add benchmark

    • 开源数据集介绍

      数据集 任务类型 语言
      FUNSD 文档信息抽取 英文
      XFUND-ZH 文档信息抽取 中文
      DocVQA-ZH 文档视觉问答 中文
      RVL-CDIP 文档图像分类 英文
    • 评测结果

      在文档智能领域主流开源数据集的验证集上评测指标如下表所示:

    Model FUNSD RVL-CDIP (sampled) XFUND-ZH DocVQA-ZH
    LayoutXLM-Base 86.72 89.65 86.24
    ERNIE-LayoutX-Base 89.31 90.13 88.58 69.86

linjieccc avatar Sep 02 '22 03:09 linjieccc