stylellm_models 请问训练数据如何处理？

请问训练数据如何处理？

Open JessyMu opened this issue 10 months ago • 3 comments

Apr 11 '24 07:04 JessyMu

No description provided.

主要就是构造平行语料的思路，小说文本先分段，再分别用回译或者大模型改写的方法给配上相应的去风格文本

Apr 12 '24 01:04 stylellm

请问训练成本高吗

Apr 28 '24 03:04 laiping-lp

请问训练成本高吗

可以用Lora训练，需要有一块16GB以上显存的GPU

Apr 29 '24 01:04 stylellm

请问是直接二次预训练吗，还是进行相关的指令微调

May 08 '24 06:05 Leekinxun

同问，顺便请问模型进行了预训练，指令微调，DPO吗？

请问是直接二次预训练吗，还是进行相关的指令微调

May 10 '24 07:05 666-bit

同问，顺便请问模型进行了预训练，指令微调，DPO吗？

May 11 '24 01:05 shenhaitao010

统一回复一下上面几个问题。发布的几个模型是在yi-6b的基础上做sft+rlhf，没有二次预训练。

May 11 '24 11:05 stylellm