ChatGLM-6B icon indicating copy to clipboard operation
ChatGLM-6B copied to clipboard

[Feature] 请问ChatGLM-6B支持batch inference吗?

Open pengqianyu opened this issue 1 year ago • 3 comments

Is your feature request related to a problem? Please describe.

请问ChatGLM-6B支持做batch inference吗?如果支持,请问怎么设置?谢谢!

Solutions

Additional context

No response

pengqianyu avatar May 25 '23 06:05 pengqianyu

同问,调查了一段时间了~

AliscaCL avatar Jun 05 '23 06:06 AliscaCL

同问,请问model.generate能批量预测么,我这边试了下batch和单条结果不一致,问题出在pad上,请问有解决办法么?

hrdxwandg avatar Jun 15 '23 10:06 hrdxwandg

同问,请问model.generate能批量预测么,我这边试了下batch和单条结果不一致,问题出在pad上,请问有解决办法么?

https://huggingface.co/THUDM/chatglm-6b/blob/main/test_modeling_chatglm.py#L120 这种方式可以

hrdxwandg avatar Jun 15 '23 13:06 hrdxwandg

同问,请问model.generate能批量预测么,我这边试了下batch和单条结果不一致,问题出在pad上,请问有解决办法么?

https://huggingface.co/THUDM/chatglm-6b/blob/main/test_modeling_chatglm.py#L120 这种方式可以

你们测试速度怎么样?我怎么看还没有循环速度快。显存24G

wangschang avatar Aug 08 '23 10:08 wangschang

同问,请问model.generate能批量预测么,我这边试了下batch和单条结果不一致,问题出在pad上,请问有解决办法么?

https://huggingface.co/THUDM/chatglm-6b/blob/main/test_modeling_chatglm.py#L120 这种方式可以

你们测试速度怎么样?我怎么看还没有循环速度快。显存24G

同问,我测下来几乎是成倍增加,预测结果是正常的

terminator123 avatar Sep 12 '23 02:09 terminator123

transformer的generate方法 bs>1的时候,到底是串行还是并行啊

terminator123 avatar Sep 12 '23 02:09 terminator123