Chinese-Vicuna
Chinese-Vicuna copied to clipboard
多轮对话导致OOM
使用Chinese-Vicuna-lora-13b-belle-and-guanaco和llama-13b-hf运行interaction.sh,经过多轮对话后,显存直接爆掉了,请问是我哪里的配置有问题吗 GPU:4090 24G 系统:ubuntu22.04
多轮对话,上下文会越拼接越长,显存消耗会逐渐变大,要把max_len设置好