codingma comments

Results 76 comments of


                                            codingma

旧版本和新版本都无法部署web界面的交互

可以先自主尝试一下不使用本项目，是否可以部署 gradio 自身的简单demo，排查一下网络问题。

请问llamafactory-cli eval支持的评估方式有哪些？

请参考 https://zhuanlan.zhihu.com/p/695287607 批量推理和eval部分

添加--group_by_length后训练一段时间后OOM

跟这个参数没有必然关系，跟你的batch_size 和cut off you关系。

添加--group_by_length后训练一段时间后OOM

group_by_length 会从大到小排序被训练，这个有什么文档可以支撑这个说法吗？

你好，感谢高一同学对项目的支持。 1. 建议先学习一下大模型相关的知识，比如openai 的官方解读 https://www.bilibili.com/video/BV1ts4y1T7UH，介绍了预训练和监督训练，强化学习的作用和区别 2. 预训练是无结构的长文本即可，就像直接看课本一样。而监督训练是指令相关，让大模型进一步掌握针对特定问题的回答方式，所以instruction 是用户的问题或者诉求，output是回答，这样的格式，类似习题册。 3. instruction和input 使用 string concat 进行拼接，可能中间会加一个 \n 4. 预训练可以参考 c4数据集和 wiki数据集

什么时候进行微调，什么时候使用RAG呢？

这个没有明确的定论，不过一般是一些动态会变化的数据会使用RAG，而一些行业里长期稳定的知识，或者特殊的输入输出格式和风格需求使用微调来处理。这个问题的讨论已经超出了本项目需要支持的范围，请更多自行探索和学习。

多模态模型微调能否支持多轮对话中包含图片输入的数据集？

目前暂时不支持过程中输入图片。

更新后，导出模型去哪了？

请参考新的readme重新安装项目，参考examples下的说明

Error Connection errored out.

please refer https://github.com/hiyouga/LLaMA-Factory?tab=readme-ov-file#fine-tuning-with-llama-board-gui-powered-by-gradio , alibaba special config is included. And refer https://github.com/hiyouga/LLaMA-Factory?tab=readme-ov-file#fine-tuning-with-llama-board-gui-powered-by-gradio to install this pakcage to get llamafactory-cli installed

codingma

旧版本和新版本都无法部署web界面的交互

请问llamafactory-cli eval支持的评估方式有哪些？

训练完后没有loss图

添加--group_by_length后训练一段时间后OOM

添加--group_by_length后训练一段时间后OOM

数据集与训练方法相关问题

什么时候进行微调，什么时候使用RAG呢？

多模态模型微调能否支持多轮对话中包含图片输入的数据集？

更新后，导出模型去哪了？

Error Connection errored out.