BELLE 关于效果的疑问

关于效果的疑问

Open Minami-su opened this issue 1 year ago • 1 comments

为什么vicuna13b只用了7万条指令数据就可以达到chatgpt的90%，而咱们这个项目用了指令数据都上百万条了，按理来说大模型的语言迁移能力应该很强啊，还是说vicuna的评测不够全面？

Apr 25 '23 01:04 Minami-su

这个你也信？只是宣传吧。

Apr 25 '23 06:04 johnny0213

vicuna13b 英文确实很强，中文受限于llama稍弱

Apr 27 '23 02:04 FrankWhh

底座模型的中文太差。vicuna自己的评测也不是很全面

Apr 28 '23 05:04 yaleimeng

嗯，明白了，期待13b的中文模型。

Apr 28 '23 05:04 Minami-su