zhangxianglink comments

Repositories
Issues
Comments

Results 1 comments of


                                            zhangxianglink

web ui 部署小模型的时候一个slot 只能部署一个模型？无法部署多个模型，即使gpu空间绰绰有余

> @wenzhaoabc 你试试 vllm 貌似不行试了，vllm要独占一块卡，改成Transformers 能在一块4090运行下面俩模型 --model-engine Transformers --gpu-idx 1 -n qwen2-instruct -f pytorch --gpu_memory_utilization 0.7 --model-engine Transformers --gpu-idx 1 -n qwen2-instruct -f pytorch