DeepSeek-Coder icon indicating copy to clipboard operation
DeepSeek-Coder copied to clipboard

Infilling怎么微调

Open timxx opened this issue 2 years ago • 1 comments

如题,是当instruct来微调么?然后加上那三个特殊的token?

timxx avatar Jan 06 '24 15:01 timxx

膜拜了下https://arxiv.org/abs/2204.05999这里的论文,发现貌似是在训练阶段做的。 哪里有详细的信息了解deepseek是怎么做的么?

timxx avatar Jan 15 '24 04:01 timxx