DeepSpeed
DeepSpeed copied to clipboard
[REQUEST]预训练模型有中文能力么?能增加中文预训练模型么?
hi,dear 大佬 我尝试了下opt-1.3b的训练过程,结果英语能力都不如意,都是I‘m sorry 不理解,你能解释下吗? https://github.com/microsoft/DeepSpeed/issues/3331
bloom 支持中文模型呀,不过效果可能也不太好 opt-1.3b 如果都是I'm sorry,那你训练失败了~