fastllm
fastllm copied to clipboard
chatglm2微调后的模型能加速 并且部署吗
chatglm2微调后的模型能加速 并且部署吗
目前不支持P-tuning微调的模型,但是支持lora和全量参数微调、冻结参数微调的模型。
推理速度会加快,可以部署