ZcChat icon indicating copy to clipboard operation
ZcChat copied to clipboard

可否能提高一下语音合成api接口的拓展性

Open yonagin opened this issue 10 months ago • 7 comments

我直接使用stylebert的接口会报错,只能自己写了一个仿照simplevits的接口

yonagin avatar Mar 12 '25 04:03 yonagin

zcchat提供了一个自定义语音合成api的选项,理论上可以支持一切提供server api的语音合成方式。你可能需要的是stylebert的API Server?

  1. 开启自定义模式。
  2. 填入API调用地址,确保输出为mp3文件,并使用 {msg} 作为文本占位符,例如: http://127.0.0.1:23456/voice/vits?id=0&text={msg}&format=mp3
  3. ZcChat > 角色配置 > 语音合成 中配置相关项

stylebert我不是很熟,需要什么特殊操作吗?

Zao-chen avatar Mar 12 '25 10:03 Zao-chen

stylebert api是fast api做的,调用接口名称不一样,而且需要传入的参数和自定义默认传入的参数有不一样的地方,还需要传入speak_name和speaker_id,而且不支持mp3公式,只能传回wav格式音频

yonagin avatar Mar 12 '25 11:03 yonagin

speak_name和speaker_id可以直接在url里写死,wav和其他音频格式将在后续版本更新。

Zao-chen avatar Mar 12 '25 11:03 Zao-chen

我调了下原来的接口,兼容了MP3格式,但还是报错,可能是fastapi是返回二进制数据而不是像flask直接返回下载文件的问题,

yonagin avatar Mar 12 '25 13:03 yonagin

是的,ZcChat是通过get方式,直接获取音频合成文件播放的

Zao-chen avatar Mar 12 '25 14:03 Zao-chen

好的,现在还有一个问题就是在聊天框输出的语音末尾感觉好像是被强行掐断了,但temp.mp3文件听起来没什么问题

yonagin avatar Mar 12 '25 14:03 yonagin

此问题已过时,因为它已打开30天,没有任何活动。如该问题仍未解决,请提供更多信息。

github-actions[bot] avatar May 21 '25 02:05 github-actions[bot]

此问题已关闭,因为自标记为过时以来,它已处于非活动状态14天。

github-actions[bot] avatar Jun 04 '25 02:06 github-actions[bot]