spicysama
spicysama
> 谢谢回复。另外还有个问题,就是下面的文字,变成语音后,会念成"三零年",而不是"三十年": > > ``` > 这里由拥有30年运营经验的吴院长领航 > ``` 最好自行设计文本替换规则
不用wsl环境,用windows环境
你用的是`post_api.py`吗?还是自己写的?po一下你的代码
> 在调用tool.api时,明明在post请求中加入了streaming参数,并且格式也是wav 但服务端依旧没有分批次返回音频流,而是全部生成完毕之后才返回,于是找到了tool/api.py 发现,InvokeRequest接收的参数中漏掉了streaming  > > 加上streaming=True之后,api调用正常,能正确返回流式音频数据了 错误的,那个只是warmup,和你实际推理没关系
不是自己写的代码就不用po出来了。。 应该是提前返回了wav_chunk_header的关系
判断啥?不用。和chunk_length有关,之前回答有误。调小一些chunk_length。 最根本的方法是开compile
Sorry for carelessness, fixed it
Maybe you need to install a brand new python=3.10 environment, then `pip install -e .`
export PYTHONPATH=$PWD
完全可行,你可以按照一门新语言来对待方言数据集。准备千小时以上数据做预训练。