fastllm
fastllm copied to clipboard
请问为什么没有给出 qwen3-next 的 q8量化?
编辑 docs/dtype_config.md 是相当简单的。我已经开始在本地执行 q8量化了。
我想问的是,没有提供 q8量化后的模型文件 是有什么原因吗?是 q8效果不好吗?