zzb213213 comments

Results 6 comments of


                                            zzb213213

api.py起的服务，合成的音频语速相较于参考音频慢很多，请问要如何调整可以生成语速较快的音频

看到了，非常感谢！

Qwen3-VL-8B和4B训练时候的GPU使用率低下

同样问题

[Bug] InternVL3-8B-hf模型使用lmdeploy脚本进行量化报错

同问，相同的报错，InternVL3-8B就可以直接量化

[Feature] Qwen3-VL turbomind support

[Bug] qwen3-vl 在线服务启动报错 Error code: 400 - {'message': 'Logprobs or top_logprobs requested but not enabled logprobs_mode in engine configuration.', 'type': 'invalid_request_error', 'code': 400, 'param': None, 'object': 'error'}

2025-11-15 11:59:12,743 - lmdeploy - WARNING - archs.py:45 - Fallback to pytorch engine because `/model/darnellzhu/Qwen-25-VL/Qwen3-VL-8B-sft` not supported by turbomind engine. huggingface/tokenizers: The current process just got forked, after parallelism has...

[Bug] qwen3-vl 在线服务启动报错 Error code: 400 - {'message': 'Logprobs or top_logprobs requested but not enabled logprobs_mode in engine configuration.', 'type': 'invalid_request_error', 'code': 400, 'param': None, 'object': 'error'}

> 请使用此提交：[02cd79b](https://github.com/InternLM/lmdeploy/commit/02cd79b6a3f9105d3a87fabb26b49b40bc084975) 采用llama_factory微调qwen3-vl，llama_factory推理结果没问题，lmdeploy推理结果完全不正确，输出格式正确

zzb213213

api.py起的服务，合成的音频语速相较于参考音频慢很多，请问要如何调整可以生成语速较快的音频

Qwen3-VL-8B和4B训练时候的GPU使用率低下

[Bug] InternVL3-8B-hf模型 使用lmdeploy脚本进行量化报错

[Feature] Qwen3-VL turbomind support

[Bug] qwen3-vl 在线服务启动报错 Error code: 400 - {'message': 'Logprobs or top_logprobs requested but not enabled logprobs_mode in engine configuration.', 'type': 'invalid_request_error', 'code': 400, 'param': None, 'object': 'error'}

[Bug] qwen3-vl 在线服务启动报错 Error code: 400 - {'message': 'Logprobs or top_logprobs requested but not enabled logprobs_mode in engine configuration.', 'type': 'invalid_request_error', 'code': 400, 'param': None, 'object': 'error'}

[Bug] InternVL3-8B-hf模型使用lmdeploy脚本进行量化报错