DeepSeek-Coder icon indicating copy to clipboard operation
DeepSeek-Coder copied to clipboard

请问一下最新发布的7b-v1.5模型不支持中间补全吗

Open Reve1ations opened this issue 2 years ago • 2 comments

最新发布的7b-v1.5模型增量训练未采用fim模式,词表中也不包含中间补全的标识符<| fim_begin|>、<| fim_hole|>、<| fim_end|>, 请问下该版模型是否还可以使用中间补全模式进行推理

Reve1ations avatar Jan 29 '24 11:01 Reve1ations

是的,该模型主要是为了弥补chat模型自然语言能力的不足

guoday avatar Jan 30 '24 02:01 guoday

了解了 多谢

Reve1ations avatar Jan 30 '24 05:01 Reve1ations

Hey folks! To double-check, does that mean that both v1.5 models, instruct and base, no longer support FIM?

valerybugakov avatar Feb 05 '24 09:02 valerybugakov

Hey folks! To double-check, does that mean that both v1.5 models, instruct and base, no longer support FIM?

yes.

guoday avatar Feb 05 '24 14:02 guoday

chat能力与 FIM能力为何不能同时兼容?

yiyepiaoling0715 avatar Feb 29 '24 03:02 yiyepiaoling0715

哪个版本是支持FIM的? 词表目前是不支持<| fim_begin|>、<| fim_hole|>、<| fim_end|> 这几个 FIM标识符的,默认会分成 [<', 'f', 'im', '', 'b', 'gin', '>', 'a', '<', 'f', 'im', '', 'hole', '>', 'a', '<', 'f', 'im', '_', 'end', '>'] , 是需要 把这几个 add_special_token么,还是就是默认的llmatokenzierfast分词方式

yiyepiaoling0715 avatar Feb 29 '24 04:02 yiyepiaoling0715

chat能力与 FIM能力为何不能同时兼容?

可以兼容,但v1.5没做FIM预训练。只有v1支持

guoday avatar Feb 29 '24 04:02 guoday

chat能力与 FIM能力为何不能同时兼容?

可以兼容,但v1.5没做FIM预训练。只有v1支持

? 词表目前是不支持<| fim_begin|>、<| fim_hole|>、<| fim_end|> 这几个 FIM标识符的,默认会分成 [<', 'f', 'im', '', 'b', 'gin', '>', 'a', '<', 'f', 'im', '', 'hole', '>', 'a', '<', 'f', 'im', '_', 'end', '>'] , 是需要 把这几个 add_special_token么,还是就是默认的llmatokenzierfast分词方式

这个问题帮解答下?

yiyepiaoling0715 avatar Feb 29 '24 04:02 yiyepiaoling0715

chat能力与 FIM能力为何不能同时兼容?

可以兼容,但v1.5没做FIM预训练。只有v1支持

? 词表目前是不支持<| fim_begin|>、<| fim_hole|>、<| fim_end|> 这几个 FIM标识符的,默认会分成 [<', 'f', 'im', '', 'b', 'gin', '>', 'a', '<', 'f', 'im', '', 'hole', '>', 'a', '<', 'f', 'im', '_', 'end', '>'] , 是需要 把这几个 add_special_token么,还是就是默认的llmatokenzierfast分词方式

这个问题帮解答下?

v1.5的词表没有这三个词,因为不支持。v1的词表有

guoday avatar Feb 29 '24 04:02 guoday