sixgod comments

Results 36 comments of


                                            sixgod

ollama 加载 glm-4-9b-chat 胡言乱语

> 您好，ollama run glm4 下载的是那个模型呢？怎么指定下载glm-4-9b-chat这个版本呢您可以事先下载`glm-4-9b-chat`到本地，或者ollama应该有地方可以设置下载模型的id

文生文微调时候是否有数据集数量限制？

问题重复，该问题请参阅[issue 591](https://github.com/THUDM/GLM-4/issues/591)，本issue关闭

请教一下，glm-4v会支持vllm推理吗？

在最近的PR中已经将GLM-4v适配了vllm=0.6.2，相信很快就会合并。您可以部署最新版的[vllm](https://github.com/vllm-project/vllm)，并且参考[PR 585](https://github.com/THUDM/GLM-4/pull/585)readme中的示例进行推理

请教一下，glm-4v会支持vllm推理吗？

> @sixsixcoder 想问下支持使用glm 4v 9b int4进行推理嘛？暂不支持

使用llama-factory进行lora微调后，推理正常，但是tools调用异常

我成功复现你的问题了，问题出现在template模版上，llama-factory到处merge后的模型文件时，替换了`glm-4-9b-chat`的`chat_template` 目前的解决方案是修改llama-factory微调merge后权重的`tokenizer_config.json`文件，替换`chat_template `为： ``` "chat_template": "[gMASK]{% for item in messages %}{% if item['tools'] is defined %}\n你是一个名为 GLM-4 的人工智能助手。你是基于智谱AI训练的语言模型 GLM-4 模型开发的，你的任务是针对用户的问题和要求提供适当的答复和支持。\n\n# 可用工具{% set tools = item['tools'] %}{% for tool in tools...

sixgod

ollama 加载 glm-4-9b-chat 胡言乱语

使用openai api调用lora微调后的模型出错

文生文微调时候是否有数据集数量限制？

文生文微调时候是否有数据集数量限制？

请教一下，glm-4v会支持vllm推理吗？

请教一下，glm-4v会支持vllm推理吗？

使用llama-factory进行lora微调后，推理正常，但是tools调用异常

用给的示示例数据tools的数据微调，后面自动多了一个Tools:None，数据处理报异常

VLLM支持问题

GLM4V-9B微调完成后，如何调用模型，输入一张图像进行对话