BELLE
BELLE copied to clipboard
原版LLaMA对中文的支持非常有限,BELLE有做中文词表扩充吗
据说原版 LLaMa的tokenizer只支持700多个中文
如果原版只支持700多个,那这个肯定扩充了的,我试了下效果还可以
https://arxiv.org/pdf/2304.07854.pdf