YulongXia

Results 1 comments of YulongXia

我的系统是Linux debian 5.10.0-20-amd64 #1 SMP Debian 5.10.158-2 (2022-12-13) x86_64 在使用llama.cpp量化了模型,得到zh-models/7B/ggml-model-q4_0.bin, 此时使用main进行预测,非常慢!!!!! ./main -m zh-models/7B/ggml-model-f16.bin --color -f prompts/alpaca.txt -ins -c 2048 --temp 0.2 -n 256 -b 2048 --repeat_penalty 1.3 ![微信图片_20230424145614](https://user-images.githubusercontent.com/41560825/233921701-2b47d13f-a9c5-43ca-aaca-7c09d05a465d.png) ![微信图片_20230424145228](https://user-images.githubusercontent.com/41560825/233920890-30bd108a-16f5-4524-864f-b0be453b4316.png)...