Results 50 comments of ZTurboX

> 使用 ernie-1.0 的预训练教程。 https://github.com/PaddlePaddle/PaddleNLP/tree/develop/model_zoo/ernie-1.0#%E4%B8%AD%E6%96%87%E9%A2%84%E8%AE%AD%E7%BB%83 > > 运行示例中 `ernie-1.0-base-zh` 全部替换 `ernie-3.0-base-zh`即可 跑run_pretrain.py报错 ![image](https://user-images.githubusercontent.com/5669444/188874605-6373933d-ab4a-4415-a4ea-122a5ba19119.png)

> mac的机器吗? 昨天用了mac调试。今天换了linux可以。但一直卡在这不动 ![image](https://user-images.githubusercontent.com/5669444/189016597-3c33a64d-b305-4b62-b025-f58b1121fc4a.png)

> 是不是语句中没有分句子?sop任务需要分句子,如果加 sop loss,可以设置 `binary_head=False` 选项。 text是一段语句。是要分句,然后\n拼接吗

> 对,换行表示分句子,空行表示分 doc。你可以设置 `binary_head=False` 先不加 sop loss跑一下 使用jieba分词和lac分词处理数据训练模型,哪种会更好

> lac 分词更准确点,jieba更快。推荐lac 跑了一段时间后,会报这个错 ![image](https://user-images.githubusercontent.com/5669444/189510184-b9da2698-71cb-4eac-8a3e-c6182e12f6bb.png)

> 大概多久,跑到什么时候出现了这个问题? > > 看起来是数据DataLoader有点问题。 跑到step869000

> 先直接重启训练试试?或者有更多报错截图吗? 这是完整的报错截图。能够重启训练。后面再看看会不会报错。

> 先直接重启训练试试?或者有更多报错截图吗? 重启训练后,同样会报错。之前没开启全词遮蔽不会报错。

> 数据方便给一份吗?我这边看能不能复现一下 要怎么给您

> 比较大的话,可以传云盘, 比如 https://drive.google.com/ 。比较小的话,也可以直接加用户群,发给我们。 数据地址,训练时不开启sop任务 链接:https://pan.baidu.com/s/19bVoWPElvPfLRjtduLJsSw 提取码:29qs