GPT-SoVITS
GPT-SoVITS copied to clipboard

Published 20 hours ago •

Reame
Issues

生成字幕

Open Jin-W-FS opened this issue 5 months ago • 1 comments

生成与音频同步的字幕：

TTS_infer_pack/TTS.py 生成与音频对应的字幕信息
api_v2.py /tts 接口可返回一JSON结构，打包音频(转为base64)和字幕
通过with_srt_format参数控制是否生成字幕和字幕的格式（目前只实现了JSON list），默认关闭，不影响其他模块

另：ref_audio_path参数可接受形如base64:xxxxxx的字符串作为base64编码的音频，免去上传音频文件这一步。

Sep 28 '24 12:09 Jin-W-FS