JavaAndPython55

Results 17 comments of JavaAndPython55

这里连接的es是docker官方镜像elasticsearch:6.3.2 建议各位同学 测试此问题的时候采用不同版本的测试下,因为在es6+中的type有了很大程度的修改。

刚测试了下,不是的。必须得自己写sql ![image](https://user-images.githubusercontent.com/34533090/98331692-0ccdbf80-2038-11eb-88ee-7cd333ee8ef0.png) 不支持实时同步,没有增量同步。就相当于你手动加了sql进行同步。将你的sql写完之后,运行。以后从另一台到另一台也能直接调用。

拉个分支,读推理ui的代码,然后改api.py的get_tts_wav,改好了,记得提交一下,让作者合并下,感谢你们~

我看了,支持的,也自己改好了,很好改的,你把gui的代码引入过来 from inference_webui import get_tts_wav get_tts_wav4ui = get_tts_wav 然后把handle的代码方法改成 gen = get_tts_wav4ui( refer_wav_path, prompt_text, prompt_language, text, text_language ) 此时要把inference_webui.py的代码,最下面的启动改成if main的形式,否则他会一直占用。就到不了api.py的界面。 然后在把gui相关的更换模型也引入过来,替换set_model里面的gpt和sovits更换的方法。这样就可以用中英混合的推理和模型切换了。 @RVC-Boss 大佬,你的这个webui.py推理可否改成if main的形式呢?不然调用你的get_tts_wav会导致他也会启动,导致进程被阻塞。我很想改动这一部分(因为api.py和推理的tts不同步,他不支持中英,但是你已经写过了),但是我担心会影响gui弹出的页面,请问这边的gui,能否改成封装成方法呢?而不是直接写到程序里,这样引入包,就会执行。

太长导致的,我也遇到过,我发现不仅仅是克隆音会出现这个问题,很多数字人开源项目也会出现,比如wav2lip。时间越久,文案越长效果越差。 这个问题我感觉不是问题,你可以分步合成,我之前遇到这个问题的时候,就把【语句拆成多段】去【单独】推理,然后在concat【拼接】就没有这个问题了。

我测试了一下,【跟gpt的预测语音和文本有很大关系】 预测语音和文本我专门弄了个半句的,【发现他就会重复读,并且合成不完整】,即使切分了也没用。 接着,我【换成】整句的,并且非常清晰的预测语音。再进行【同样的切分】合成测试。就正常了,没有发现之前的重复读的问题。你也可以换着预测语音和文本试试。

【你给的那段我合成】了,【没有问题】,切分后,读的都是正常的。 切分我用的是sox,然后自己写的脚本 脚本大概是:先删除之前的wav音频,用split切分文本,然后每段文案单独合成,保存各个音频,然后用sox将音频合并。

怎么会呢,不用在config.py里面指定,直接调用api.py的set_model就可以动态切换,不用关闭程序。

进度条,应该是能承受的推理字数,你的最大token字数不能超过1500。