Llama-Chinese
Llama-Chinese copied to clipboard
13b 词表扩了多少,支持多大上下文长度
正在训练的拓展到65000 ,在不调整rope scale 的情况下,是4096 。调整rope scale目前测试18k 效果也还不错
正在训练的拓展到65000 ,在不调整rope scale 的情况下,是4096 。调整rope scale目前测试18k 效果也还不错
扩充的中文词表是怎么来的可以公开吗
正在训练的拓展到65000 ,在不调整rope scale 的情况下,是4096 。调整rope scale目前测试18k 效果也还不错
你只需要调整rope scale吗,在微调过程中需要调整SFTTrainer中的max_seq_length值吗,另外,您的GPU配置情况方便说明一下嘛