qwen.cpp
qwen.cpp copied to clipboard
什么时候出server功能
类似llama.cpp的 ./server -m /models/ggml-model-q4_0.bin --host 0.0.0.0 --ctx-size2048 --n -gpu -layers 128