LongWriter icon indicating copy to clipboard operation
LongWriter copied to clipboard

上下文长度。我没有在说明中找到关于long writer的上下文长度,是否是沿用的glm4-128k的输入上下文长度。

Open mhzn-yn opened this issue 1 year ago • 3 comments

System Info / 系統信息

我想知道long writer 的输入上下文长度,在整篇文章中,只写了输出的长度。麻烦作者告知,万分感谢。 第二个问题:微调训练,是否可以在windows 上使用LLaMA-Factory。 LLaMA-Factory上有标注支持glm4微调。如果不支持,还请给点相关信息。

Who can help? / 谁可以帮助到您?

No response

Information / 问题信息

  • [x] The official example scripts / 官方的示例脚本
  • [x] My own modified scripts / 我自己修改的脚本和任务

Reproduction / 复现过程

我想知道long writer 的输入上下文长度,在整篇文章中,只写了输出的长度。麻烦作者告知,万分感谢。 第二个问题:微调训练,是否可以在windows 上使用LLaMA-Factory。 LLaMA-Factory上有标注支持glm4微调。

Expected behavior / 期待表现

期待回复,万分感谢。

mhzn-yn avatar Sep 29 '24 07:09 mhzn-yn

LongWriter的上下文长度为32k(输入长度+输出长度),但是我们在训练数据中并没有加入长输入的数据,模型可能在长输入场景下表现不理想。我们推荐在glm4-9b模型上做微调训练,你只需要下载LongWriter-6k数据即可,直接用LLaMA-Factory的代码就可以训练。

bys0318 avatar Sep 29 '24 13:09 bys0318

感谢。

mhzn-yn avatar Sep 30 '24 05:09 mhzn-yn

明白了。

mhzn-yn avatar Sep 30 '24 05:09 mhzn-yn