PaddleNLP icon indicating copy to clipboard operation
PaddleNLP copied to clipboard

ernie3预训练

Open ZTurboX opened this issue 3 years ago • 22 comments

在自己语料上,对ernie3提供的模型上做二次预训练,是怎么做的

ZTurboX avatar Sep 07 '22 07:09 ZTurboX

使用 ernie-1.0 的预训练教程。 https://github.com/PaddlePaddle/PaddleNLP/tree/develop/model_zoo/ernie-1.0#%E4%B8%AD%E6%96%87%E9%A2%84%E8%AE%AD%E7%BB%83

运行示例中 ernie-1.0-base-zh 全部替换 ernie-3.0-base-zh即可

ZHUI avatar Sep 07 '22 08:09 ZHUI

使用 ernie-1.0 的预训练教程。 https://github.com/PaddlePaddle/PaddleNLP/tree/develop/model_zoo/ernie-1.0#%E4%B8%AD%E6%96%87%E9%A2%84%E8%AE%AD%E7%BB%83

运行示例中 ernie-1.0-base-zh 全部替换 ernie-3.0-base-zh即可

跑run_pretrain.py报错 image

ZTurboX avatar Sep 07 '22 12:09 ZTurboX

mac的机器吗?

ZHUI avatar Sep 07 '22 16:09 ZHUI

mac的机器吗?

昨天用了mac调试。今天换了linux可以。但一直卡在这不动 image

ZTurboX avatar Sep 08 '22 01:09 ZTurboX

是不是语句中没有分句子?sop任务需要分句子,如果加 sop loss,可以设置 binary_head=False 选项。

ZHUI avatar Sep 08 '22 03:09 ZHUI

是不是语句中没有分句子?sop任务需要分句子,如果加 sop loss,可以设置 binary_head=False 选项。

text是一段语句。是要分句,然后\n拼接吗

ZTurboX avatar Sep 08 '22 03:09 ZTurboX

对,换行表示分句子,空行表示分 doc。你可以设置 binary_head=False 先不加 sop loss跑一下

ZHUI avatar Sep 08 '22 03:09 ZHUI

对,换行表示分句子,空行表示分 doc。你可以设置 binary_head=False 先不加 sop loss跑一下

使用jieba分词和lac分词处理数据训练模型,哪种会更好

ZTurboX avatar Sep 09 '22 01:09 ZTurboX

lac 分词更准确点,jieba更快。推荐lac image

ZHUI avatar Sep 09 '22 02:09 ZHUI

lac 分词更准确点,jieba更快。推荐lac image

跑了一段时间后,会报这个错 image

ZTurboX avatar Sep 11 '22 02:09 ZTurboX

大概多久,跑到什么时候出现了这个问题?

看起来是数据DataLoader有点问题。

ZHUI avatar Sep 14 '22 06:09 ZHUI

大概多久,跑到什么时候出现了这个问题?

看起来是数据DataLoader有点问题。

跑到step869000

ZTurboX avatar Sep 14 '22 06:09 ZTurboX

先直接重启训练试试?或者有更多报错截图吗?

ZHUI avatar Sep 14 '22 06:09 ZHUI

先直接重启训练试试?或者有更多报错截图吗?

这是完整的报错截图。能够重启训练。后面再看看会不会报错。

ZTurboX avatar Sep 14 '22 07:09 ZTurboX

先直接重启训练试试?或者有更多报错截图吗?

重启训练后,同样会报错。之前没开启全词遮蔽不会报错。

ZTurboX avatar Sep 14 '22 23:09 ZTurboX

数据方便给一份吗?我这边看能不能复现一下

ZHUI avatar Sep 15 '22 06:09 ZHUI

数据方便给一份吗?我这边看能不能复现一下

要怎么给您

ZTurboX avatar Sep 15 '22 06:09 ZTurboX

比较大的话,可以传云盘, 比如 https://drive.google.com/ 。比较小的话,也可以直接加用户群,发给我们。

ZHUI avatar Sep 15 '22 06:09 ZHUI

比较大的话,可以传云盘, 比如 https://drive.google.com/ 。比较小的话,也可以直接加用户群,发给我们。

数据地址,训练时不开启sop任务 链接:https://pan.baidu.com/s/19bVoWPElvPfLRjtduLJsSw 提取码:29qs

ZTurboX avatar Sep 15 '22 11:09 ZTurboX

比较大的话,可以传云盘, 比如 https://drive.google.com/ 。比较小的话,也可以直接加用户群,发给我们。

最新的报错,是不是因为多进程分布式的原因,我只有一张卡训练 image

ZTurboX avatar Sep 16 '22 00:09 ZTurboX

单卡可以训练,多卡报错 LAUNCH INFO 2022-11-03 17:02:47,657 Pod failed INFO 2022-11-03 17:02:47,657 controller.py:109] Pod failed LAUNCH ERROR 2022-11-03 17:02:47,657 Container failed !!! Container rank 0 status failed cmd ... 这是什么情况呢?

prettyprettyboy avatar Nov 04 '22 02:11 prettyprettyboy

建议check一下paddle环境paddle.utils.run_check()

ZHUI avatar Nov 04 '22 06:11 ZHUI

This issue is stale because it has been open for 60 days with no activity. 当前issue 60天内无活动,被标记为stale。

github-actions[bot] avatar Jan 04 '23 00:01 github-actions[bot]

This issue was closed because it has been inactive for 14 days since being marked as stale. 当前issue 被标记为stale已有14天,即将关闭。

github-actions[bot] avatar Jan 18 '23 00:01 github-actions[bot]