ekho icon indicating copy to clipboard operation
ekho copied to clipboard

是否有可能只通过一个声调的音源构造出其他声音?

Open ShizuhaAki opened this issue 2 years ago • 1 comments

这是一个技术问题。

假设出于某种原因,我只能获取到某一个声调(不妨假定为 1)的声音,从技术上讲,是否可能通过它构造出其他声调?

如果可以的话,那么为歌声合成软件所准备的音源(例如 UTAU)就可以在 ekho 中使用。

ShizuhaAki avatar Jan 18 '23 16:01 ShizuhaAki

我曾经用praat做过这件事。先从已有的声音文件中分析出不同声调的轮廓,然后把这个轮廓应用到新的声音,大致是可以生成不同声调的。

不过,由于最终效果不及真人录制,我没有推进研发,已做的工作也不知道放哪里了。

至于歌声合成,我也是尝试做过的,但是效果惨不忍睹。这个和改变声调不完全相同。歌声中一个字的基频(pitch)应该是比较稳定的,而声调的基频其实是发生变化的。目前的pitch是可以调整的,但是我想,可能这个值的计算不是很准,调整到目标pitch的算法也不是很准确,最终导致出来的效果很差。

有一个叫“酷狗唱唱”的K歌软件,里面有个一键修音的功能,修音后评分会更高,但我个人觉得听起来更难听。

这种技术还是需要做很多研究,对每一个细节都做得很好才能有比较好的效果。也许可以从深度学习方向突破。我不太懂。

hgneng avatar Jan 27 '23 10:01 hgneng