UER-py issues

使用第三方预训练模型的参数设置问题

您好，我在Modelzoo提供的腾讯云链接中下载了HFL的chinese-roberta-wwm-ext-pytorch.bin，请问在执行run_classifier.py时parameter中--spm_model_path应该如何设置？

kxy-cheng

gate_cnn 模型GPU多卡训练报错

1

python环境： GPU cuda配置多卡跑bert模型预训练是可以的

TestNLP

预训练的分类和微调中的分类微调有什么区别

在预训练中有target为cls的预训练任务，在fintune中也有用于分类的微调请问对于同一分类数据，使用这两种分类训练有什么区别？

lizhipengpeng

非常感谢您的分享。22年11月的时候我在model zoo里下载了weibo_bert_base_model.bin、mixed_corpus_bert_base_model.bin等模型，当时model zoo提供基于各种数据的预训练模型。这两天我想找同样数据集训练的ALBERT模型对比，发现model zoo里提供的预训练模型只剩基于clue corpus训练的部分模型了，请问原来的预训练模型（比如基于weibo数据等）还提供么，可否给出下载链接。

StudentxOne

支持deepspeed的分支

owner你好，看起来master并不支持deepspeed，请问哪个分支是可以支持deepspeed的，并且requirements里能把deepspeed的支持版本写清楚吗

zhang2010hao

请教下有gpt2的微调的相关文档么？

2

hi大佬 [gpt2-chinese](https://huggingface.co/uer/gpt2-chinese-cluecorpussmall)，我看了，但是没有相关微调的代码，[在此](https://huggingface.co/uer/gpt2-chinese-cluecorpussmall)看到了如下代码，但是数据格式没有告知，也不知道是不是纯文本， ``` python3 preprocess.py --corpus_path corpora/cluecorpussmall.txt \ --vocab_path models/google_zh_vocab.txt \ --dataset_path cluecorpussmall_lm_seq128_dataset.pt \ --seq_length 128 --processes_num 32 --data_processor lm ``` 请教下这个是微调的代码么？

ucas010

处理长文本的问题

在预处理阶段过长的文本是如何处理的呢，是直接截断了吗。目前想要做一个阅读理解的任务，但是需要针对自己的语料库进行增量预训练，语料库文档长度大多超过500，这是需要将文档分成子句再去做预处理比较好吗。

UknowSth

mBART？

**您的工作很棒**，预训练模型的加载和训练方法，令我震惊，但是我似乎没有找到mBART的对应方法，包括数据集的构建和预处理代码。我只找到了BART的，请问他们一样吗？ ![image](https://github.com/dbiir/UER-py/assets/58644245/e5be302e-d9fc-4800-97dd-bb7e06aaf6dd)

5i-wanna-be-the-666

请问wwm不适用于生成mlm+nsp格式的数据吗？

运行process.py生成数据时，--data_processor默认是'bert'，这样生成的是mlm+nsp的数据。我在设置--whole_word_masking时，发现由于mask.py中的create_index函数没有删除src前后句子之间的分隔符[SEP]，该函数返回的tokens_index, src并不能准确反映整词掩码，主要原因就是中间的[SEP]被分为了'[', 'sep', ']'。前来确认一下，在设置wwm接口的时候，是不是没有考虑生成mlm+nsp格式的数据，只能用于--data_processor设置为'mlm'的情况？

dr-GitHub-account

预训练问题

请问该代码主要是针对无监督训练那块的嘛

Clearloveplus7

UER-py
UER-py copied to clipboard

Metadata

使用第三方预训练模型的参数设置问题

gate_cnn 模型GPU多卡训练报错

预训练的分类和微调中的分类微调有什么区别

model zoo里的一些预训练模型找不到了

支持deepspeed的分支

请教下有gpt2的微调的相关文档么？

处理长文本的问题

mBART？

请问wwm不适用于生成mlm+nsp格式的数据吗？

预训练问题

← Metadata

Owner

Metadata

UER-py UER-py copied to clipboard

Metadata

← Metadata

Owner

Metadata

UER-py
UER-py copied to clipboard