PaddleNLP
PaddleNLP copied to clipboard
PaddleNLP 2.4.1 Release Note Candidate
New Features
ERNIE-Layout
- 新增多语言跨模态文档预训练模型ERNIE-Layout,新增Benchmark及基于ERNIE-Layout的各类下游任务的微调及部署示例。#3183
- 新增DocPrompt文档抽取问答模型,支持Taskflow一键调用。#3183
Pipelines
- 新增Docker cuda11.2镜像,并提供Docker编译教程。#3315
- 新增Pipelines批量处理数据。 #3432
- 新增一些用户反馈的FAQ和README文档的优化。 #3237
- 新增Milvus2.1的支持。#3283
Question Generation
- 新增问题生成example,覆盖中文场景和英文场景。#3410
- 新增问题生成taskflow。#3438
Compression API
- 压缩 API 支持 ERNIE、ERNIE-M、BERT、TinyBERT、ELECTRA 等 NLU 模型。#3234 #3324
- DynBERT 宽度自适应裁剪策略支持分布式训练。#3361
Prompt API
- 新增 Prompt API 使用文档。#3362
TIPC
- 迁移Ernie三个任务的TIPC脚本代码。https://github.com/PaddlePaddle/PaddleNLP/pull/3302
- 修复 bigru_crf 推理随机hang的问题。 https://github.com/PaddlePaddle/PaddleNLP/pull/3418
Bug Fix
- 修复了小样本文本分类中的失效链接以及在 windows 平台上推理时的数据类型问题。#3339 #3426
- FAQ Finance 的Milvus升级为2.1版本,文档优化。#3267 #3430
- 基于检索的文本分类代码简化和README优化。 #3322
- Neural Search的文档优化。#3350
- 修复了UIE的Dataloader在加载数据时可能导致内存溢出的问题。#3381
- 修复DuEE序列标注代码导包错误。https://github.com/PaddlePaddle/PaddleNLP/pull/2853
- 修复Pillow warning问题。 https://github.com/PaddlePaddle/PaddleNLP/pull/3404 和 https://github.com/PaddlePaddle/PaddleNLP/pull/3457
- 更新artist模型的激活函数,修复dallebart中的warning,https://github.com/PaddlePaddle/PaddleNLP/pull/3106
- 修复Ernie tokenizer当中模型名称类型缺失的问题 https://github.com/PaddlePaddle/PaddleNLP/pull/3423
- 修复Bert单测中CI没检测到的Bug https://github.com/PaddlePaddle/PaddleNLP/pull/3422
- 修复动转静过程中对OrderedDict数据类型不支持的问题 https://github.com/PaddlePaddle/PaddleNLP/pull/3364
Others
- 添加Stable Diffusion的Licence https://github.com/PaddlePaddle/PaddleNLP/pull/3210
- 更新文档中微信群二维码。https://github.com/PaddlePaddle/PaddleNLP/pull/3284
- Processor和FeatureExtractor支持from_pretrained和save_pretrained https://github.com/PaddlePaddle/PaddleNLP/pull/3453
- 添加T5EncoderModel的单测 https://github.com/PaddlePaddle/PaddleNLP/pull/3376
- 添加9个模型的多输入输出和单测代码 https://github.com/PaddlePaddle/PaddleNLP/pull/3305