MonkeyCode
MonkeyCode copied to clipboard
Qwen3-Coder模型支持补全
可以参考一下这里 https://www.jamesflare.com/vllm-continue-autocomplete-qwen3-coder/
后台补全模型配置的时候,选择使用/v1/chat/completions还是/v1/completions
具体Qwen3的格式如图:
希望能尽快适配 ,相信小于30B的Coder模型很快就会发布,届时如果不能从2.5切到3的话,感觉体验很不好 ~