LLaVA-NeXT Do we have some inference accelerate method for new llava-next-video models?

Do we have some inference accelerate method for new llava-next-video models?

Open LetheRiver0 opened this issue 1 year ago • 1 comments

Hi, Amazing job for new llava-next-video model! Since it has 34B params and maybe need more than 1 GPU, so do we have support some inference accelerate method for new llava-next-video models? like sglang deploy. Thanks~

Jul 17 '24 15:07 LetheRiver0

LLaVA-NeXT LLaVA-NeXT copied to clipboard

Do we have some inference accelerate method for new llava-next-video models?

LLaVA-NeXT
LLaVA-NeXT copied to clipboard