Chinese-LLaMA-Alpaca icon indicating copy to clipboard operation
Chinese-LLaMA-Alpaca copied to clipboard

以后的训练中会增加max length吗

Open heshuguo opened this issue 1 year ago • 2 comments

感谢您使用Issue提问模板,请按照以下步骤提供相关信息。我们将优先处理信息相对完整的Issue,感谢您的配合。

提示:将[ ]中填入x,表示打对钩。提问时删除上面这两行。请只保留符合的选项,删掉其他。

详细描述问题

请问在后面的训练中会增加max length吗?我看7B和13B都是512,有可能会增加到2048或者4096吗?

运行截图或log

(如有必要)请提供文本log或者运行截图,以便我们更好地了解问题详情。

必查项目

  • [ ] 哪个模型的问题:LLaMA / Alpaca (只保留你要问的)
  • [ ] 问题类型:(只保留你要问的)
    • 下载问题
    • 模型转换和合并
    • 模型推理问题(🤗 transformers)
    • 模型量化和部署问题(llama.cpp、text-generation-webui、LlamaChat)
    • 效果问题
    • 其他问题
  • [ ] 由于相关依赖频繁更新,请确保按照Wiki中的相关步骤执行
  • [ ] 我已阅读FAQ章节并且已在Issue中对问题进行了搜索,没有找到相似问题和解决方案
  • [ ] 第三方插件问题:例如llama.cpptext-generation-webuiLlamaChat等,同时建议到对应的项目中查找解决方案

heshuguo avatar May 09 '23 07:05 heshuguo

原版llama最大长度是2048。后续可能会考虑扩展到这么长,但也要顾及算力方面,所以无法保证一定会发布。

ymcui avatar May 09 '23 09:05 ymcui

原版llama最大长度是2048。后续可能会考虑扩展到这么长,但也要顾及算力方面,所以无法保证一定会发布。

了解。多谢解答。 @ymcui

heshuguo avatar May 09 '23 10:05 heshuguo

This issue has been automatically marked as stale because it has not had recent activity. It will be closed if no further activity occurs. Thank you for your consideration.

github-actions[bot] avatar May 16 '23 22:05 github-actions[bot]

Closing the issue, since no updates observed. Feel free to re-open if you need any further assistance.

github-actions[bot] avatar May 19 '23 22:05 github-actions[bot]