FCH-TTS
FCH-TTS copied to clipboard
A fast Text-to-Speech (TTS) model. Work well for English, Mandarin/Chinese, Japanese, Korean, Russian and Tibetan (so far). 快速语音合成模型,适用于英语、普通话/中文、日语、韩语、俄语和藏语(当前已...
我根据bbspeech.yaml的配置自己训练了中文模型,但是效果不好,不出声音。 GPU :3060RTX12G 时长:24小时 数据集:Baker BS:64 目前不知道是不是训练的步骤有问题,导致没有效果
dear atomicoo: There is error url : https://open-speech-data.oss-cn-hangzhou.aliyuncs.com, can not download data when run prepare_dataset.py and could U pls share the the structure of directory “datasets” ,it's differece between your...
Env: (Nvidia T4,torch 1.9.0) Tried the quick start with steps: $ conda create -n ParallelTTS python=3.7.9 $ conda activate ParallelTTS $ pip install -r requirements.txt $ python synthesize.py \ --checkpoint...
如题,我已经同过其他方法生成语音。
你好,请问模型有日文的吗?我看现在项目上的模型是ljspeech的,用这个来转日文是会报错的,报错如下: RuntimeError: Calculated padded input size per channel: (5). Kernel size: (7). Kernel size can't be greater than actual input size 假如要自己训练日文模型,下载 JPSpeech-1.1.tar.bz2时失败,链接无法打开,有其他方式可以获取吗?目前只能下载 jsut_ver1.1 数据集,里面只有wav音频,下载对应的basic5000的lab标注信息,并没有metedata.csv文件
https://github.com/atomicoo/FCH-TTS/issues/4
您好!很兴奋能够看到有一个支持藏语语音合成的tts系统,我很好奇您是如何处理藏语文本的。具体来说就是您是使用了藏语字符作为输入,还是说是将藏语转成了音素进行输入?如果转成音素的话,您是基于规则做的,使用的是由了lexion还是您选择了别的方法转成了音素?最后关于藏语转成音素以及对应声调的问题,您这边处理了吗,或者说是您这边有什么好的方法进行藏语转音素以及对应的声调呢!