DeepSeek-Coder
DeepSeek-Coder copied to clipboard
Infilling怎么微调
如题,是当instruct来微调么?然后加上那三个特殊的token?
膜拜了下https://arxiv.org/abs/2204.05999这里的论文,发现貌似是在训练阶段做的。 哪里有详细的信息了解deepseek是怎么做的么?