GPT-SoVITS icon indicating copy to clipboard operation
GPT-SoVITS copied to clipboard

生成字幕

Open Jin-W-FS opened this issue 5 months ago • 1 comments

生成与音频同步的字幕:

  • TTS_infer_pack/TTS.py 生成与音频对应的字幕信息
  • api_v2.py /tts 接口可返回一JSON结构,打包音频(转为base64)和字幕
  • 通过with_srt_format参数控制是否生成字幕和字幕的格式(目前只实现了JSON list),默认关闭,不影响其他模块

另:ref_audio_path参数可接受形如base64:xxxxxx的字符串作为base64编码的音频,免去上传音频文件这一步。

Jin-W-FS avatar Sep 28 '24 12:09 Jin-W-FS