AgentTuning icon indicating copy to clipboard operation
AgentTuning copied to clipboard

基于fastchat部署,推理异常

Open ruifengma opened this issue 2 years ago • 3 comments

用fastchat部署AgentLM-13B,推理的时候格式是乱的,尤其是streaming的模式,每行只有几个字符就切换到下一行了,一个单词被切成了好几个字母或字母组合。如果手动用transformer加载并用gradio展示的话就没有这个问题,用fastchat的debug模式看了一下,用的是LlamaForCausalLM加载的模型,应该没错

ruifengma avatar Dec 01 '23 02:12 ruifengma

我们之前没有在 FastChat 上进行过推理实验。能否给出更详细的报错、不符合预期的场景或者配置?

Btlmd avatar Dec 18 '23 10:12 Btlmd

用fastchat部署AgentLM-13B,推理的时候格式是乱的,尤其是streaming的模式,每行只有几个字符就切换到下一行了,一个单词被切成了好几个字母或字母组合。如果手动用transformer加载并用gradio展示的话就没有这个问题,用fastchat的debug模式看了一下,用的是LlamaForCausalLM加载的模型,应该没错

老师,请问您是怎么操作的呢

heimy2000 avatar Jan 25 '24 06:01 heimy2000

hi @Btlmd @heimy2000 , 其实就是简单的使用 fastchat.serve.cli 来加载模型进行基础对话,其实没有报错,只是输出的chunk就很奇怪并且不成句,其实你们可以试试看,操作很简单 python3 -m fastchat.serve.cli --model-path AgentTuning/AgentLM --model-path后面就是加的实际存储的AgentLM权重

ruifengma avatar Feb 01 '24 03:02 ruifengma