brooks

Results 12 issues of brooks

代码中好像只有one shot的train和inference,怎么进行zero shot ?

我注意到微调代码中语音采取的32k的代码进行load,为何有保存了32k的语音,保存的语音是用来做什么的?我想用16k的语音进行微调,不知道效果会不会有影响?

In follow-up

"I'm wondering if tuning multiple speakers simultaneously will make the tuned model adapt to multiple speakers or worsen it.

今天测试流式的接口,看代码应该是按照文本进行切分,分段合成后输出语音流。但是实际调用过程中发现所有的文本合成后才收到了流式的语音,这个是什么情况。。是我调用方式有问题吗,还是本来就是这样我代码看错了

I found that some English is output as all uppercase when doing ASR in English. Why is this?Capitalization is considered a letter by me (non-native English speaker), how can I...

cosyvoice3 准备开源吗

采用原始的模型使用jit及trt之后加速比较明显,使用自己训练的模型发现速度提升很小,有没有遇到的同学。

**Describe the bug** 目前一直采用的是flow的非cache版本,发现flow模块生成onnx 会失败。看到issue里面说把export_onnx.py里面的assert注释可以成功。 ![Image](https://github.com/user-attachments/assets/ad00c464-8857-4a52-9ed7-a4debc298226) 于是将assert注释,但是注释过后,生成trt模型又发生了报错。 ![Image](https://github.com/user-attachments/assets/1679d409-dfc6-4e2c-8ac7-07caa1f44227) 求了解的大佬指导,如何生成自己的onnx模型和trt模型。

有人在欧拉版本上编译过吗,目前使用发现欧拉版本存在内存泄露的情况。有人遇到过相同问题吗