swift
swift copied to clipboard
swift export 指定 --tensor_parallel_size --gpu_memory_utilization 感觉不管用
swift export 对百川2进行awq量化 指定 --tensor_parallel_size --gpu_memory_utilization 感觉根本不管用,指定4张卡,只会用两张卡,然后就是爆显存
swift export 对百川2进行awq量化 指定 --tensor_parallel_size --gpu_memory_utilization 感觉根本不管用,指定4张卡,只会用两张卡,然后就是爆显存