GLM-4 GLM4V-9B微调完成后，如何调用模型，输入一张图像进行对话

GLM4V-9B微调完成后，使用以下命令 CUDA_VISIBLE_DEVICES=0 swift export
--ckpt_dir output/glm4v-9b-chat/vx-xxx/checkpoint-xxx
--merge_lora true

CUDA_VISIBLE_DEVICES=0 swift infer
--ckpt_dir output/glm4v-9b-chat/vx-xxx/checkpoint-xxx-merged
--load_dataset_config true

得到了一个checkpoint-xxx-merged文件夹。文件夹中内容如图：微信图片_20240830231518

如何使用这个文件夹中的模型？

No response

GLM4V-9B微调完成后，使用以下命令 CUDA_VISIBLE_DEVICES=0 swift export
--ckpt_dir output/glm4v-9b-chat/vx-xxx/checkpoint-xxx
--merge_lora true

CUDA_VISIBLE_DEVICES=0 swift infer
--ckpt_dir output/glm4v-9b-chat/vx-xxx/checkpoint-xxx-merged
--load_dataset_config true

得到了一个checkpoint-xxx-merged文件夹。

能够调用微调后的模型实现单张图像的对话。

Aug 30 '24 15:08 tw-repository

学习infer的方法读入模型，然后直接用cli_vision demo解决

Aug 31 '24 17:08 zRzRzRzRzRzRzR

学习infer的方法读入模型，然后直接用cli_vision demo解决

请问有infer的方法读入模型的案例吗？我没有搜到相关的参考资料

Sep 02 '24 07:09 tw-repository

案例是？我们现在刚准备合并了vllm lora合并

Sep 04 '24 12:09 zRzRzRzRzRzRzR

请问现在是否支持vllm加速如何才能支持VLLM加速，谢谢 sss

Oct 12 '24 09:10 elesun2018

目前已经支持vllm加速推理，暂不支持lora微调后的模型加速，请参见readme

Oct 21 '24 10:10 sixsixcoder