GPT2-Chinese icon indicating copy to clipboard operation
GPT2-Chinese copied to clipboard

finetune需要的语料量+output上限

Open jyan1999 opened this issue 1 year ago • 2 comments

请问一下,我想用这个生成短篇小说,目标大概是至少1000到2000字,但如果可以的话越多越好。请问这个模型能够输出这么多token么?如果想达到比较好的效果需要多少语料?非常感谢!

jyan1999 avatar Mar 26 '23 05:03 jyan1999

输出的字符长度可以自己改。如果要有比较好的生成效果的话个人实测模型参数量要300M以上,语料大小要在200MB以上

greatmfc avatar Apr 27 '23 04:04 greatmfc

thankyou

lishangru avatar Apr 27 '23 04:04 lishangru