Baichuan2
Baichuan2 copied to clipboard
baichuan2 v2-8k 和v1-4K的区别
请问HF上v2 branch的8K模型和v1 branch的4k模型具体有哪些区别呢?整体上v1和v2的生成风格似乎有一些差异,且虽然最大长度变长了,但整体效果上似乎v2要略差一些。这块有v2版本的评测指标嘛?
能说一下哪些case变差了吗?
v2主要强化的是数学和逻辑推理、复杂指令跟随能力。
能说一下哪些case变差了吗?
v2主要强化的是数学和逻辑推理、复杂指令跟随能力。
主要感觉是在写作类任务上,v2版本写作格式更丰富,但内容更少,更空泛,试了好几个类型的习作任务,都有类似的感觉。
能说一下哪些case变差了吗? v2主要强化的是数学和逻辑推理、复杂指令跟随能力。
主要感觉是在写作类任务上,v2版本写作格式更丰富,但内容更少,更空泛,试了好几个类型的习作任务,都有类似的感觉。
好的~收到反馈,我们会研究一下
请问HF上v2 branch的8K模型和v1 branch的4k模型具体有哪些区别呢?整体上v1和v2的生成风格似乎有一些差异,且虽然最大长度变长了,但整体效果上似乎v2要略差一些。这块有v2版本的评测指标嘛?
你好,请问可以求一下v2-8k的包吗,非常感谢~,我只有3090,想要自己量化的时候,发现24G不够。