KAN-TTS icon indicating copy to clipboard operation
KAN-TTS copied to clipboard

KAN-TTS is a speech-synthesis training framework, please try the demos we have posted at https://modelscope.cn/models?page=1&tasks=text-to-speech

Results 42 KAN-TTS issues
Sort by recently updated
recently updated
newest added

想知道这个操作不会使一个字的推理出现问题吗?我在16k的模型上(https://modelscope.cn/models/iic/speech_personal_sambert-hifigan_nsf_tts_zh-cn_pretrain_16k),微调后推理一个字发音完全不正确....

比如:“介绍下AP1000的材料” 会将字母A读成拼音a,其他字母发音正常,请问有什么解决方法么

Is there any way export the models to onnx? or deploy it via c++?

举例,哈 '-' 这个 斜杠 在不同句子里面读不同的音调。但是sambert模型大部分都读错了 附:德荷大赛对决一览2012年欧洲杯小组赛德国2-1荷兰2004年欧洲杯小组赛(2-1 读成 zhi 应该读bi) 隶属于VX-23测试中队的F-35C“闪电II”舰载隐身战机与DDG-1000隐身战舰合影。(- 读成 gang 应该不读) 堪萨斯州的彩票玩家密苏里曾于2009年9月9日投注了号码“9-9-9”, (- 读成 gang 应该不读) 2001年8月-2002年:协助宾利欧陆GT轿跑车的设计工作,(- 读成 fu 应该读dao) 类似于这种读错的符号,或者其他字母符号 这个通过sambert模型,训练新的定向数据,能解决吗? 将以上的参数变成正确的输出 还是说,语音合成模型只能训练音色,不能改变语义

Hi everyone! My name is David Martin Rius and I have just published this project on GitHub: https://github.com/davidmartinrius/speech-dataset-generator/ Now you can **create datasets automatically** with any audio or lists of...

最好能提供 ONNX, 这样可以在各种场景部署,这方面 FunASR 就非常优秀

请问speech_sambert-hifigan_tts_zh-cn_multisp_pretrain_16k这个模型能同时训练多个说话人吗?

1. Adding chunk_forward function for FsmnEncoderV2 and MemoryBlockV2 module, which is based on cache and implement streaming inference chunk by chunk; 2. Reconstruct the forward function of KanTtsSAMBERT, extract the...