ChatGLM-Tuning
ChatGLM-Tuning copied to clipboard
怎么使用训练好的lora做int8推理?
感觉用了loara比原版慢了很多,我的是V100