Chinese-Vicuna icon indicating copy to clipboard operation
Chinese-Vicuna copied to clipboard

请问这个的效果和vicuna相比怎么样

Open rayvzn119 opened this issue 1 year ago • 5 comments

和原版vicuna相比,这个的效果如何,尤其是中文方面

rayvzn119 avatar Apr 24 '23 10:04 rayvzn119

同问。另外请问跟https://github.com/lm-sys/FastChat的vicuna关系是什么?

fireice009 avatar Apr 25 '23 08:04 fireice009

python都有语法错误,这都什么玩意

lmclmc avatar Apr 25 '23 10:04 lmclmc

@rayvzn119 standford的vicuna主要是全量微调+不开8bit+全长度(2048),他们之前的那个效果一般,不过在最近的V1.1版本效果挺好的,基底是13B模型。我们主要在7B上的模型+lora+8bit上进行训练,由于资源所限,我们目前的目标还是在小资源下如何提高中文能力。目前中文能力确实是不如他们的13B的V1.1版本。 @fireice009 可以参考这个issue

Facico avatar Apr 26 '23 03:04 Facico

@lmclmc 作为一个开源项目,如果你遇到了错误,欢迎提供给我们,我们做出即时的修改

Facico avatar Apr 26 '23 03:04 Facico

python都有语法错误,这都什么玩意

别人辛辛苦苦开源,耐心解答问题。

没有收你一毛钱,没有夸大项目秒天秒地,怎么到你口中就成了"什么玩意"?

好好说话有那么难么?

Eriice avatar Apr 30 '23 18:04 Eriice

@rayvzn119 standford的vicuna主要是全量微调+不开8bit+全长度(2048),他们之前的那个效果一般,不过在最近的V1.1版本效果挺好的,基底是13B模型。我们主要在7B上的模型+lora+8bit上进行训练,由于资源所限,我们目前的目标还是在小资源下如何提高中文能力。目前中文能力确实是不如他们的13B的V1.1版本。 @fireice009 可以参考这个issue

期待基于13B做一个效果更好的~

ldfandian avatar May 24 '23 08:05 ldfandian