vllm
vllm copied to clipboard

Published 20 hours ago •

Reame
Issues

Can you choose which GPU to use. like tf inference device_map="cuda:0"

Open wellcasa opened this issue 11 months ago • 8 comments

As the title suggests

Mar 13 '24 12:03 wellcasa