stylellm_models icon indicating copy to clipboard operation
stylellm_models copied to clipboard

请问训练数据如何处理?

Open JessyMu opened this issue 10 months ago • 3 comments

JessyMu avatar Apr 11 '24 07:04 JessyMu

No description provided.

主要就是构造平行语料的思路,小说文本先分段,再分别用回译或者大模型改写的方法给配上相应的去风格文本

stylellm avatar Apr 12 '24 01:04 stylellm

请问训练成本高吗

laiping-lp avatar Apr 28 '24 03:04 laiping-lp

请问训练成本高吗

可以用Lora训练,需要有一块16GB以上显存的GPU

stylellm avatar Apr 29 '24 01:04 stylellm

请问是直接二次预训练吗,还是进行相关的指令微调

Leekinxun avatar May 08 '24 06:05 Leekinxun

同问,顺便请问模型进行了预训练,指令微调,DPO吗?

请问是直接二次预训练吗,还是进行相关的指令微调

666-bit avatar May 10 '24 07:05 666-bit

同问,顺便请问模型进行了预训练,指令微调,DPO吗?

shenhaitao010 avatar May 11 '24 01:05 shenhaitao010

统一回复一下上面几个问题。 发布的几个模型是在yi-6b的基础上做sft+rlhf,没有二次预训练。

stylellm avatar May 11 '24 11:05 stylellm