DeepSeek-Coder
DeepSeek-Coder copied to clipboard
deepseek coder能够在base模型基础上继续与训练吗?
我看模型架构沿用了和llama一致的transformer结构,是不是这continual training的模式也是差不多的?这一块能给更多的细节吗?
一致的,所以你可以使用自己的数据继续预训练
@guoday 能提供下预训练的脚步和数据样例么,谢谢