UER-py icon indicating copy to clipboard operation
UER-py copied to clipboard

请教下有gpt2的微调的相关文档么?

Open ucas010 opened this issue 2 years ago • 2 comments

hi大佬 gpt2-chinese,我看了,但是没有相关微调的代码,在此看到了如下代码,但是数据格式没有告知,也不知道是不是纯文本,

python3 preprocess.py --corpus_path corpora/cluecorpussmall.txt \
                      --vocab_path models/google_zh_vocab.txt \
                      --dataset_path cluecorpussmall_lm_seq128_dataset.pt \
                      --seq_length 128 --processes_num 32 --data_processor lm

请教下这个是微调的代码么?

ucas010 avatar Feb 13 '23 06:02 ucas010

请问你解决了吗

terminator123 avatar Feb 22 '23 03:02 terminator123

同问,没有格式,不知道怎么准备语料

hahazei avatar Jul 05 '23 03:07 hahazei