inference
inference copied to clipboard
输入长文本,九千字左右,28kb, 调用 glm4-chat 没有返回
已经设置了最大token
This issue is stale because it has been open for 7 days with no activity.
This issue is stale because it has been open for 7 days with no activity.
你的图片没有上传成功。你的max_model_len设置了没有?
[我遇到同样的问题,虽然设置了max_model_len,而且模型跑在2、3号gpu卡上,但是报错,提示gpu0没有资源,但是长文本无法识别。 #2405