ChatTTS
ChatTTS copied to clipboard
Zero shot (simulate speaker) 无法克隆
def on_upload_sample(sample_audio_input: Optional[str]) -> str: sample_audio = torch.tensor(load_audio(sample_audio_input, 24000)).to('cpu') spk_smp = chat.sample_audio_speaker(sample_audio) del sample_audio return spk_smp
spk_smb = on_upload_sample(r"input.wav")
params_infer_code = ChatTTS.Chat.InferCodeParams( spk_smp=spk_smb, txt_smp="从 博 弈 论 的 定 义 中 我 们 知 道 [uv_break] , 双 方 [uv_break] 或 者 多 方 [uv_break] 进 行 博 弈 的 最 终 目 的 [uv_break] , 都 是 为 自 己 争 取 [uv_break] 最 大 利 益 [uv_break] 。", )
wav = chat.infer( text, params_infer_code=params_infer_code, )
无法克隆input的声音。