杨永全

Results 18 comments of 杨永全

I want to know how to finetune. Thank you.

Looking forward to the new version.

禁用了所有插件,使用classic2022和default主题都有这个错误。

评论是存在的。其他文章也有这个问题。 如果需要我可以提供数据库。 我在本地全新安装,然后导入数据,也是一样的。

SAPI5 适配器不需要考虑如何安装那些隐情,因为那些隐情大多数都提供有 http 的api。通过 http 请求发送需要合成的文本,返回音频数据。 我的想法是 SAPI5 适配器提供一个配置程序,用来配置 http 请求所需的参数。 添加一个 http请求就可以作为一个 SAPI5 的声音角色。然后生成一个 son的 配置。 比如下面的例子就是配置了一个叫做 小美的 SAPI5 的角色。 `{text}` 到时候替换成具体的朗读文本。 ``` { "name":"小美", "url": "http://127.0.0.1:5000", "method": "POST",...

一些不错的开源 tts,除了 piper 之外,其他的几的的中文都还不错。 * [fish-speech](https://github.com/fishaudio/fish-speech) * [f5-tts](https://github.com/swivid/f5-tts) * [gpt-sovits](https://github.com/rvc-boss/gpt-sovits) * [cosyvoice](https://github.com/funaudiollm/cosyvoice) * [piper](https://github.com/rhasspy/piper)

这些都是不支持xml标记的。他们现在提供的 API 都非常的简陋,基本上就只能返回音频数据了。

我觉得要支持现有的这些开源的 AI TTS 的话,单词边界这些视健就只能舍弃了。 语速、音量、音高这些可能也的自己实现。 工作量不小的。