Zero shot (simulate speaker) 无法克隆

Open jianglin-code opened this issue 1 month ago • 0 comments

def on_upload_sample(sample_audio_input: Optional[str]) -> str: sample_audio = torch.tensor(load_audio(sample_audio_input, 24000)).to('cpu') spk_smp = chat.sample_audio_speaker(sample_audio) del sample_audio return spk_smp

spk_smb = on_upload_sample(r"input.wav")

params_infer_code = ChatTTS.Chat.InferCodeParams( spk_smp=spk_smb, txt_smp="从博弈论的定义中我们知道 [uv_break] ，双方 [uv_break] 或者多方 [uv_break] 进行博弈的最终目的 [uv_break] ，都是为自己争取 [uv_break] 最大利益 [uv_break] 。", )

wav = chat.infer( text, params_infer_code=params_infer_code, )

无法克隆input的声音。

input.wav

Nov 15 '25 13:11 jianglin-code