KAN-TTS issues

min_wav_length 去除0.5s以下的样本

2

想知道这个操作不会使一个字的推理出现问题吗？我在16k的模型上(https://modelscope.cn/models/iic/speech_personal_sambert-hifigan_nsf_tts_zh-cn_pretrain_16k)，微调后推理一个字发音完全不正确....

Shuigs18

英文字母A的发音有问题

比如：“介绍下AP1000的材料” 会将字母A读成拼音a，其他字母发音正常，请问有什么解决方法么

Chengyang852

how to deploy the model via c++

5

Is there any way export the models to onnx? or deploy it via c++?

shen2009fei

举例，哈 '-' 这个斜杠在不同句子里面读不同的音调。但是sambert模型大部分都读错了附:德荷大赛对决一览2012年欧洲杯小组赛德国2-1荷兰2004年欧洲杯小组赛（2-1 读成 zhi 应该读bi）隶属于VX-23测试中队的F-35C“闪电II”舰载隐身战机与DDG-1000隐身战舰合影。（- 读成 gang 应该不读）堪萨斯州的彩票玩家密苏里曾于2009年9月9日投注了号码“9-9-9”，（- 读成 gang 应该不读） 2001年8月-2002年:协助宾利欧陆GT轿跑车的设计工作，（- 读成 fu 应该读dao）类似于这种读错的符号，或者其他字母符号这个通过sambert模型，训练新的定向数据，能解决吗？将以上的参数变成正确的输出还是说，语音合成模型只能训练音色，不能改变语义

wukongbuku

请问ttsfrd有计划发布windows的版本吗？

多谢

violet17

[CONTRIBUTION] Speech Dataset Generator

Hi everyone! My name is David Martin Rius and I have just published this project on GitHub: https://github.com/davidmartinrius/speech-dataset-generator/ Now you can **create datasets automatically** with any audio or lists of...

davidmartinrius

希望像 FunASR 一样，提供 C++ 推理

4

最好能提供 ONNX，这样可以在各种场景部署，这方面 FunASR 就非常优秀

endink

EricFuma

KAN-TTS
KAN-TTS copied to clipboard

Metadata

min_wav_length 去除0.5s以下的样本

英文字母A的发音有问题

how to deploy the model via c++

请教一下，语音合成，语义相关问题

请问ttsfrd有计划发布windows的版本吗？

[CONTRIBUTION] Speech Dataset Generator

希望像 FunASR 一样，提供 C++ 推理

关于多说话人的疑问

官方能提供转模型转onnx的脚本吗？自己做有点困难

add function of am streaming inference

← Metadata

Owner

Metadata

KAN-TTS KAN-TTS copied to clipboard

Metadata

← Metadata

Owner

Metadata

KAN-TTS
KAN-TTS copied to clipboard