Cameron Wong comments

Results 98 comments of


                                            Cameron Wong

编译出错

这个报错告诉你缺少依赖的sndfile库，你需要安装libsndfile1-dev，这个依赖在INSTALL文件里有描述。

build error

Please remove --enable-festival option, it's a bit hard to build with Festival and not recommended. Let me know if you do want to build with Festival and I will try...

我在我的系统上没有重现这个问题。你的Ekho版本是最新的吗？你把音频保存到文件：ekho "这是一个测试" -o demo.wav 然后play demo.wav试试，也可以把demo.wav放到其它系统播放试试。我偶尔也会遇到这种情况，不一定在Linux，不一定是Ekho。就是在播放音频的时候，前后有些音频有时不能被播放。尤其是短的音频。我觉得这可能是声音驱动里一些缓存相关的问题。好像用Audacity来打开文件播放能比较明显地重现这个问题。

Test ehko error

Tibetan data is removed by default. test_ekho fail to run without it. I have commented out test for Tibetan and commited. Festival support is a bit hard to build. Please...

转换后的语音还不是很自然，请问这方面有改进计划吗？

迟些可能会做些尝试，但不要有暂时不要有太大期望。

是否有可能只通过一个声调的音源构造出其他声音？

我曾经用praat做过这件事。先从已有的声音文件中分析出不同声调的轮廓，然后把这个轮廓应用到新的声音，大致是可以生成不同声调的。不过，由于最终效果不及真人录制，我没有推进研发，已做的工作也不知道放哪里了。至于歌声合成，我也是尝试做过的，但是效果惨不忍睹。这个和改变声调不完全相同。歌声中一个字的基频（pitch）应该是比较稳定的，而声调的基频其实是发生变化的。目前的pitch是可以调整的，但是我想，可能这个值的计算不是很准，调整到目标pitch的算法也不是很准确，最终导致出来的效果很差。有一个叫“酷狗唱唱”的K歌软件，里面有个一键修音的功能，修音后评分会更高，但我个人觉得听起来更难听。这种技术还是需要做很多研究，对每一个细节都做得很好才能有比较好的效果。也许可以从深度学习方向突破。我不太懂。

github上, 没有visual studio的工程, 官网的教程中显示有

为了遵从Debian的一些规范，在这次提交中移除了： https://github.com/hgneng/ekho/commit/f35d4ddadf3a18713ff211f2d6db1f0aa1547f92 当时应该移到一个新的repo里的。你可以在这个地方下载，在sapi5目录： https://github.com/hgneng/ekho/releases/tag/v8.9.3

Cameron Wong