xubinxinant
xubinxinant
你看看max token是不是设置的太小了,默认是2048,加大一点
> max token我设置了一万,一般输出1000个字左右就会停住不写了 看看后台输出,是完整内容还是停止了
> +1, chatpgpt4 and chatglm2-6b support 32k tokens but wenda's setting is between 0 and 4096, the the default just 2048 token limit can be set max to 10k,please check...
说一下我的环境,仅供参考。 4090卡,chatglm2-6b fp16.(加载模型后占用约15GB) 文档大小14m pdf。50页(对话占用21.5GB,可以正常对话,max token拉到10000以上,防止不出结果)