Baichuan2 icon indicating copy to clipboard operation
Baichuan2 copied to clipboard

baichuan2 v2-8k 和v1-4K的区别

Open DSXiangLi opened this issue 1 year ago • 4 comments

请问HF上v2 branch的8K模型和v1 branch的4k模型具体有哪些区别呢?整体上v1和v2的生成风格似乎有一些差异,且虽然最大长度变长了,但整体效果上似乎v2要略差一些。这块有v2版本的评测指标嘛?

DSXiangLi avatar Jan 29 '24 03:01 DSXiangLi

能说一下哪些case变差了吗?

v2主要强化的是数学和逻辑推理、复杂指令跟随能力。

baichuan-assistant avatar Jan 30 '24 04:01 baichuan-assistant

能说一下哪些case变差了吗?

v2主要强化的是数学和逻辑推理、复杂指令跟随能力。

主要感觉是在写作类任务上,v2版本写作格式更丰富,但内容更少,更空泛,试了好几个类型的习作任务,都有类似的感觉。

DSXiangLi avatar Jan 30 '24 11:01 DSXiangLi

能说一下哪些case变差了吗? v2主要强化的是数学和逻辑推理、复杂指令跟随能力。

主要感觉是在写作类任务上,v2版本写作格式更丰富,但内容更少,更空泛,试了好几个类型的习作任务,都有类似的感觉。

好的~收到反馈,我们会研究一下

baichuan-assistant avatar Jan 31 '24 13:01 baichuan-assistant

请问HF上v2 branch的8K模型和v1 branch的4k模型具体有哪些区别呢?整体上v1和v2的生成风格似乎有一些差异,且虽然最大长度变长了,但整体效果上似乎v2要略差一些。这块有v2版本的评测指标嘛?

你好,请问可以求一下v2-8k的包吗,非常感谢~,我只有3090,想要自己量化的时候,发现24G不够。

gaotiesuanna avatar Feb 25 '24 15:02 gaotiesuanna