Cameron Wong

Results 98 comments of Cameron Wong

这个报错告诉你缺少依赖的sndfile库,你需要安装libsndfile1-dev,这个依赖在INSTALL文件里有描述。

Please remove --enable-festival option, it's a bit hard to build with Festival and not recommended. Let me know if you do want to build with Festival and I will try...

你需要这个库:libutfcpp-dev,见INSTALL文件。

我在我的系统上没有重现这个问题。 你的Ekho版本是最新的吗? 你把音频保存到文件:ekho "这是一个测试" -o demo.wav 然后play demo.wav试试,也可以把demo.wav放到其它系统播放试试。 我偶尔也会遇到这种情况,不一定在Linux,不一定是Ekho。就是在播放音频的时候,前后有些音频有时不能被播放。尤其是短的音频。我觉得这可能是声音驱动里一些缓存相关的问题。好像用Audacity来打开文件播放能比较明显地重现这个问题。

Tibetan data is removed by default. test_ekho fail to run without it. I have commented out test for Tibetan and commited. Festival support is a bit hard to build. Please...

迟些可能会做些尝试,但不要有暂时不要有太大期望。

我曾经用praat做过这件事。先从已有的声音文件中分析出不同声调的轮廓,然后把这个轮廓应用到新的声音,大致是可以生成不同声调的。 不过,由于最终效果不及真人录制,我没有推进研发,已做的工作也不知道放哪里了。 至于歌声合成,我也是尝试做过的,但是效果惨不忍睹。这个和改变声调不完全相同。歌声中一个字的基频(pitch)应该是比较稳定的,而声调的基频其实是发生变化的。目前的pitch是可以调整的,但是我想,可能这个值的计算不是很准,调整到目标pitch的算法也不是很准确,最终导致出来的效果很差。 有一个叫“酷狗唱唱”的K歌软件,里面有个一键修音的功能,修音后评分会更高,但我个人觉得听起来更难听。 这种技术还是需要做很多研究,对每一个细节都做得很好才能有比较好的效果。也许可以从深度学习方向突破。我不太懂。

为了遵从Debian的一些规范,在这次提交中移除了: https://github.com/hgneng/ekho/commit/f35d4ddadf3a18713ff211f2d6db1f0aa1547f92 当时应该移到一个新的repo里的。 你可以在这个地方下载,在sapi5目录: https://github.com/hgneng/ekho/releases/tag/v8.9.3