codingma comments

Results 76 comments of


                                            codingma

mac m2 芯片Lora 后的模型推理结果都是乱码

目前看是训练的时候就有问题，loss异常地大。可以再试一下其他模型，比如qwen1.5-0.5B ，我这边可以正常训练。对比一下可能是什么环节的问题

mac m2 芯片Lora 后的模型推理结果都是乱码

mac 只能支持单精度的训练，没有办法做混合精度，不确定是不是两个版本的模型的数据格式有区别导致的。

昇腾Ascend 910B llama-factory如何适配npu？

昇腾相关用户可以加入这个交流群 ![img_v3_02ap_12409f4b-3caf-41a0-9d86-d823a9b9cfag](https://github.com/hiyouga/LLaMA-Factory/assets/11713241/4844a63d-3780-4350-8c3a-dbf8d952751c)

LLama3-8b - Galore-unsloth conflict dtype after save step

Unsloth and GaLore can't be used simultaneously.

autoDL无法打开UI界面

文件可以下载的 `wget https://cdn-media.huggingface.co/frpc-gradio-0.2/frpc_linux_amd64`

想问下如何设置自定义的系统提示词呢

训练阶段可以在 dataset_info.json 给数据集指定 system 的字段

想问下如何设置自定义的系统提示词呢

unsloth 的 use_gradient_checkpointing 的值默认就是 "unsloth" 通过 --use_unsloth 开启

llamafactory-cli 启动方式让人迷惑体验感差，请考虑恢复python src/... 这样的启动方式

``` llamafactory-cli api -h: launch an API server llamafactory-cli chat -h: launch a chat interface in CLI llamafactory-cli eval -h: do evaluation llamafactory-cli export -h: merge LoRA adapters and export...