fastllm
fastllm copied to clipboard
模型导出失败,hf上下载的flm模型可以正常在GPU上运行
开启cuda编译后进行模型导出,模型加载完成后进程被kill
模型加载完成后显存占用没上升。
hf上下载flm模型运行正常且运行在GPU上。
转模型是在内存上做的,可能是内存爆了