note-gen icon indicating copy to clipboard operation
note-gen copied to clipboard

[bug] 语音服务几乎不可用

Open 4965898 opened this issue 4 months ago • 0 comments

详细描述这个 Bug

最新版本中虽然有了语音功能,但几乎不可用。 我试过调用百炼、硅基流动、智谱等平台的语音模型,均不可用 原因如下: 语音模型与对话模型地址不一样,而BaseURL会自动补全地址且不能强制使用自定义,这样反而使得调用语音模型的专有地址不可用,如硅基流动使用https://api.siliconflow.cn/v1/audio/transcriptions才能调用语音模型;百炼则是:dashscope.aliyuncs.com/api-ws/v1/realtime 因此无论是TTS还是STT均无法使用。

NoteGen 版本

v0.22.3

操作系统

Windows

报错日志

No response

4965898 avatar Nov 06 '25 14:11 4965898