PaddleNLP issues

ernie3.0量化模型部署错误：Hint: Expected kernel_iter != kernels.end(), but received kernel_iter == kernels.end()

1

版本、环境信息 1）PaddleNLP和PaddlePaddle版本：PaddleNLP 2.3.4，paddlepaddle-gpu 2.3.1.post116 2）系统环境：Windows10企业版，python38，cuda11.6，cudnn8.4 复现信息： *********** dataloader的数据类型为int64：'input_ids': Tensor(shape=[32, 90], dtype=int64, place=Place(gpu:0), stop_gradient=True 训练评估、裁剪、量化分别执行，其中训练和裁剪顺利执行单独执行量化的时候有两种情况：paddle.static.InputSpec的dtype设置为int32时可顺利完成量化，其他则不行，配置如下 : input_spec = [ paddle.static.InputSpec(shape=[None, None], dtype="int64"), # input_ids paddle.static.InputSpec(shape=[None, None], dtype="int64") # segment_ids ]...

Fmaj7

[Unittest]add tinybert unittest

1

### PR types New features ### PR changes Models ### Description add tinybert unittest

wj-Mcat

使用PaddleNLP训练文本多标签分类，多核心CPU只使用到了一个核心，怎么使用多核心进行训练？

欢迎您反馈PaddleNLP使用问题，非常感谢您对PaddleNLP的贡献！： - 版本、环境信息 1）PaddleNLP和PaddlePaddle版本：PaddleNLP，PaddlePaddle 使用的是docker直接部署：docker pull paddlecloud/paddlenlp:develop-cpu-latest 2）系统环境：系统类型：Linux，Python 3.7.13 启动训练脚本命令：python -m paddle.distributed.launch train.py --device cpu --dataset_dir ./data **问题：启动训练后，只能用CPU其中的一个核心进行训练,怎么使用多核心？** 系统CPU占用情况： ![微信图片_20220810121728](https://user-images.githubusercontent.com/8132404/183815925-52682216-17cf-4d4e-87ef-49f007a66571.jpg)

ht896632

Add unittest for RoBERTa

### PR types unittest ### PR changes Models ### Description Add unittest for RoBERTa

yingyibiao

Add text semantic matching for taskflow

### PR types + New features ### PR changes + Models ### Description + Add text semantic matching for Taskflow

w5688414

taskflow

text-similarity

pipelines

paddle2.3复现SBert训练结果不可复现，并且性能相比较torch大为下降

20

使用paddle2.3.1.post112/cuda11.2/3090显卡/paddlenlp2.3.4/Linux/python3.7环境复现SBert的时候，固定随机种子 paddle.seed(100) random.seed(100) np.random.seed(100) 并且使用FLAGS_cudnn_deterministic = True结果仍然不能复现，每次训练的acc指标都不能loss也不同；同torch版本对比，在同一个数据集上(paws_x)，同一个Bert预训练权重 bert-wwm-ext-chinese下： torch则可以复现，并且torch的acc为0.75(torch不设置随机种子的时候结果也是瞎飞)，paddle的acc0.55-0.62之间随机出现；请问是环境版本问题还是paddle框架问题还是我代码问题？怎么解决？

HUSTHY

skep情感分析模型预测每次结果都不一样

8

欢迎您反馈PaddleNLP使用问题，非常感谢您对PaddleNLP的贡献！在留下您的问题时，辛苦您同步提供如下信息： - 版本、环境信息 1）PaddleNLP和PaddlePaddle版本： paddlenlp 2.3.4 paddlepaddle-gpu 2.3.0.post112 2）系统环境：请您描述系统类型，例如Linux/Windows/MacOS/，python版本 Linux CentOS7 python 3.9.7 有点怀疑模型参数可能哪里没有初始化好 PaddleNLP/examples/sentiment_analysis/skep/predict_sentence.py

AnitaSherry

2w条训练数据长度为256的文本，4ktest和dev过拟合正常吗？

1

![image](https://user-images.githubusercontent.com/35884699/183578691-e036f657-9a9e-45eb-a860-4db257b41b05.png) ![image](https://user-images.githubusercontent.com/35884699/183578750-87d946e8-a746-45ac-93e4-7865ef04926b.png)

zoeChen119

当TrainingArguments中的report_to参数不指定时，将会报错

3

![图片](https://user-images.githubusercontent.com/28768547/183584490-7bb1c5ad-b073-442a-9c0c-ce417e58925e.png) 文档中https://paddlenlp.readthedocs.io/zh/latest/trainer.html?highlight=TrainingArguments#trainingarguments 说明可以不指定，应该是哪里赋值出了问题

CatIIIIIIII

UIE事件抽取数据格式疑问

3

按照这个文档 https://github.com/PaddlePaddle/PaddleNLP/blob/develop/model_zoo/uie/doccano.md#53-%E4%BA%8B%E4%BB%B6%E6%8A%BD%E5%8F%96 的描述，事件抽取需要标注实体类别以及关系，那么一些开源的数据是不是就无法使用了？比如下面这条数据： {"id": 7285, "text": "约翰逊（图：BBC）星岛环球网消息：【海外网4月6日|战疫全时区】据英国天空新闻网5日报道，英国首相约翰逊住院接受新冠病毒测试，10天前即3月27日他在社交媒体上发文称，自己新冠病毒检测结果呈阳性，正在自我隔离", "labels": [{"trigger": ["接受", 55], "object": ["英国首相约翰逊", 46], "subject": ["新冠病毒测试", 57], "time": "", "location": ""}], "distant_trigger": ["隔离", "测试", "接受", "检测"]} 这样的数据可以作为UIE的训练数据么？如果可以的话该怎么修改呢？

miaodog

FAQ

PaddleNLP
PaddleNLP copied to clipboard

Metadata

ernie3.0量化模型部署错误：Hint: Expected kernel_iter != kernels.end(), but received kernel_iter == kernels.end()

[Unittest]add tinybert unittest

使用PaddleNLP训练文本多标签分类，多核心CPU只使用到了一个核心，怎么使用多核心进行训练？

Add unittest for RoBERTa

Add text semantic matching for taskflow

paddle2.3复现SBert训练结果不可复现，并且性能相比较torch大为下降

skep情感分析模型预测每次结果都不一样

2w条训练数据长度为256的文本，4ktest和dev过拟合正常吗？

当TrainingArguments中的report_to参数不指定时，将会报错

UIE事件抽取数据格式疑问

← Metadata

Owner

Metadata

PaddleNLP PaddleNLP copied to clipboard

Metadata

← Metadata

Owner

Metadata

PaddleNLP
PaddleNLP copied to clipboard