Langchain-Chatchat icon indicating copy to clipboard operation
Langchain-Chatchat copied to clipboard

如何改成多卡推理?

Open nameless0704 opened this issue 1 year ago • 5 comments

nameless0704 avatar Apr 13 '23 08:04 nameless0704

+1

qianchen94 avatar Apr 14 '23 03:04 qianchen94

可以考虑参考chatglm-6b项目的issue中关于使用accelerate进行多卡推理的内容

qianchen94 @.***>于2023年4月14日 周五11:30写道:

+1

— Reply to this email directly, view it on GitHub https://github.com/imClumsyPanda/langchain-ChatGLM/issues/77#issuecomment-1507878465, or unsubscribe https://github.com/notifications/unsubscribe-auth/ABLH5EWM2LKEOHJMQ4MO7EDXBDAG5ANCNFSM6AAAAAAW4YG4HM . You are receiving this because you are subscribed to this thread.Message ID: @.***>

imClumsyPanda avatar Apr 14 '23 03:04 imClumsyPanda

改成单机多卡推理,AutoModel里加上device_map='auto'之后会报错:tensor不在同一个device上,但是sentencetransformers里读的embeddings和langchain UnstructedFileLoader好像(暂时)都没法multigpu……所以根本不能在一个device?

nameless0704 avatar Apr 14 '23 06:04 nameless0704

你好,你最后有实现多卡推理吗?我是一台机器有4个3080,一个卡有点不ok,想4个卡一起推理。

wengieeee avatar May 15 '23 09:05 wengieeee

项目里面默认检测卡数,所以一个会分配到不同卡上

imClumsyPanda avatar May 15 '23 09:05 imClumsyPanda

webui.py 运行后只有GPU 0占用显存多,其他卡显存不够,应该怎么配置啊

caowenhero avatar Aug 01 '23 04:08 caowenhero

由于该issue长期不活跃,开发组将其关闭,可以在最新代码上重新尝试。如果有需求可以重新提起

zRzRzRzRzRzRzR avatar Sep 27 '23 12:09 zRzRzRzRzRzRzR

如果支持多卡的话 很多卡可以盘活

xsin333 avatar Dec 22 '23 05:12 xsin333