JittorLLMs icon indicating copy to clipboard operation
JittorLLMs copied to clipboard

提问:我启动之后随便说个你好,chatglm回答的速度特别慢是为什么呢?

Open qflxy opened this issue 2 years ago • 11 comments
trafficstars

屏幕截图 2023-04-06 194457 屏幕截图 2023-04-06 194546 上面是我的启动参数和启动之后的界面,每次输入一个问题之后要等几分钟才会得到结果

qflxy avatar Apr 06 '23 11:04 qflxy

第一次运行需要需要编译,之后应该就不需要了,速度和readme里的截图差不多

cjld avatar Apr 06 '23 11:04 cjld

第一次运行需要需要编译,之后应该就不需要了,速度和readme里的截图差不多

第一次编译之后运行速度还是很慢,显存占用也有,

qflxy avatar Apr 06 '23 11:04 qflxy

请问您用的是什么显卡,我这边用3090每秒应该能超过20个token

cjld avatar Apr 06 '23 12:04 cjld

显存不够就是会很慢的

cjld avatar Apr 06 '23 12:04 cjld

我用的是2060,因为我看您在readme里面说的是成本低,没有显卡,2G内存就能跑大模型,人人皆可在普通机器上,实现大模型本地部署,所以我就设置了上限4g显存和16g内存进行尝试,

qflxy avatar Apr 06 '23 12:04 qflxy

不同机器根据环境速度也会有差异的,我们实测4G的显卡大概一秒出1~2个字左右,后续还将不断优化该模型库

cjld avatar Apr 06 '23 12:04 cjld

好的,我这边虽然速度慢,但是确实可以运行起来,这对我们这些小显存确实大有帮助,谢谢,期待你们的后续优化

qflxy avatar Apr 06 '23 12:04 qflxy

谢谢您的支持,后续我们会针对2060这类小显存的显卡做一些针对性的优化,有望提升1-2倍速度

cjld avatar Apr 06 '23 12:04 cjld

1060 6G 确实比较慢。大概一秒出1~2个字左右。

philipxiaoxi avatar Apr 08 '23 14:04 philipxiaoxi

限制了8G内存,无显卡,10分钟才出3个字。。。。。

glacierck avatar Jun 01 '23 06:06 glacierck

不同机器根据环境速度也会有差异的,我们实测4G的显卡大概一秒出1~2个字左右,后续还将不断优化该模型库

image 3分36秒

image

TcDhlPro avatar Jul 01 '23 07:07 TcDhlPro