Qwen-VL icon indicating copy to clipboard operation
Qwen-VL copied to clipboard

💡 [REQUEST] - 推理加速框架

Open skyantao opened this issue 1 year ago • 6 comments

起始日期 | Start Date

01062024

实现PR | Implementation PR

Qwen-VL 有加速框架吗?如vLLm 或者 llama.cpp等类似框架, 我觉得推理速度有点慢,一张图片我的3090 需要3-5秒

相关Issues | Reference Issues

5️⃣

摘要 | Summary

Qwen-VL 有加速框架吗?如vLLm 或者 llama.cpp等类似框架, 感觉推理速度有点慢,一张图片解析3090 需要3-5秒

基本示例 | Basic Example

Qwen-VL 有加速框架吗?如vLLm 或者 llama.cpp等类似框架, 我觉得推理速度有点慢,一张图片我的3090 需要3-5秒

缺陷 | Drawbacks

Qwen-VL 有加速框架吗?如vLLm 或者 llama.cpp等类似框架, 我觉得推理速度有点慢,一张图片我的3090 需要3-5秒

未解决问题 | Unresolved questions

如题

skyantao avatar Jan 06 '24 08:01 skyantao

同问

jessiewiswjc avatar Jan 09 '24 09:01 jessiewiswjc

同问

grygg avatar Mar 20 '24 03:03 grygg

可以问下你是怎么实现的吗?

起始日期 | Start Date

01062024

实现PR | Implementation PR

Qwen-VL 有加速框架吗?如vLLm 或者 llama.cpp等类似框架, 我觉得推理速度有点慢,一张图片我的3090 需要3-5秒

相关Issues | Reference Issues

5️⃣

摘要 | Summary

Qwen-VL 有加速框架吗?如vLLm 或者 llama.cpp等类似框架, 感觉推理速度有点慢,一张图片解析3090 需要3-5秒

基本示例 | Basic Example

Qwen-VL 有加速框架吗?如vLLm 或者 llama.cpp等类似框架, 我觉得推理速度有点慢,一张图片我的3090 需要3-5秒

缺陷 | Drawbacks

Qwen-VL 有加速框架吗?如vLLm 或者 llama.cpp等类似框架, 我觉得推理速度有点慢,一张图片我的3090 需要3-5秒

未解决问题 | Unresolved questions

如题

可以问下你是怎么实现的吗?如 llama.cpp

chuangzhidan avatar Mar 28 '24 09:03 chuangzhidan

用lmdeploy可以

xuexidi avatar Jun 12 '24 08:06 xuexidi

Thanks♪(・ω・)ノ

chuangzhidan avatar Jun 13 '24 09:06 chuangzhidan

RTP-LLM 这个项目 上手有难度, 文档写的稀碎,但是实力确实不错

invisifire avatar Aug 20 '24 10:08 invisifire