stylellm_models
stylellm_models copied to clipboard
请问训练数据如何处理?
No description provided.
主要就是构造平行语料的思路,小说文本先分段,再分别用回译或者大模型改写的方法给配上相应的去风格文本
请问训练成本高吗
请问训练成本高吗
可以用Lora训练,需要有一块16GB以上显存的GPU
请问是直接二次预训练吗,还是进行相关的指令微调
同问,顺便请问模型进行了预训练,指令微调,DPO吗?
请问是直接二次预训练吗,还是进行相关的指令微调
同问,顺便请问模型进行了预训练,指令微调,DPO吗?
统一回复一下上面几个问题。 发布的几个模型是在yi-6b的基础上做sft+rlhf,没有二次预训练。