spicysama

Results 123 comments of spicysama

> 谢谢回复。另外还有个问题,就是下面的文字,变成语音后,会念成"三零年",而不是"三十年": > > ``` > 这里由拥有30年运营经验的吴院长领航 > ``` 最好自行设计文本替换规则

不用wsl环境,用windows环境

你用的是`post_api.py`吗?还是自己写的?po一下你的代码

> 在调用tool.api时,明明在post请求中加入了streaming参数,并且格式也是wav 但服务端依旧没有分批次返回音频流,而是全部生成完毕之后才返回,于是找到了tool/api.py 发现,InvokeRequest接收的参数中漏掉了streaming ![image](https://private-user-images.githubusercontent.com/11146882/341621313-5c1dad86-ae7f-4450-8484-c270c978fd55.png?jwt=eyJhbGciOiJIUzI1NiIsInR5cCI6IkpXVCJ9.eyJpc3MiOiJnaXRodWIuY29tIiwiYXVkIjoicmF3LmdpdGh1YnVzZXJjb250ZW50LmNvbSIsImtleSI6ImtleTUiLCJleHAiOjE3MTg5NDU1MTAsIm5iZiI6MTcxODk0NTIxMCwicGF0aCI6Ii8xMTE0Njg4Mi8zNDE2MjEzMTMtNWMxZGFkODYtYWU3Zi00NDUwLTg0ODQtYzI3MGM5NzhmZDU1LnBuZz9YLUFtei1BbGdvcml0aG09QVdTNC1ITUFDLVNIQTI1NiZYLUFtei1DcmVkZW50aWFsPUFLSUFWQ09EWUxTQTUzUFFLNFpBJTJGMjAyNDA2MjElMkZ1cy1lYXN0LTElMkZzMyUyRmF3czRfcmVxdWVzdCZYLUFtei1EYXRlPTIwMjQwNjIxVDA0NDY1MFomWC1BbXotRXhwaXJlcz0zMDAmWC1BbXotU2lnbmF0dXJlPTJmYTk1Y2I5Zjg0ZTA2ZmM3NWM3ZjU0YmEyZmUwNzNiZWQ2YmFmZGEzZjdjYjhiMDVmNDRhYmMxNmM0NmZjZjEmWC1BbXotU2lnbmVkSGVhZGVycz1ob3N0JmFjdG9yX2lkPTAma2V5X2lkPTAmcmVwb19pZD0wIn0.TtX06KEJT3kc5ySwYl7JxrG5UpuAwRSPtn82GCzjV_w) > > 加上streaming=True之后,api调用正常,能正确返回流式音频数据了 错误的,那个只是warmup,和你实际推理没关系

不是自己写的代码就不用po出来了。。 应该是提前返回了wav_chunk_header的关系

判断啥?不用。和chunk_length有关,之前回答有误。调小一些chunk_length。 最根本的方法是开compile

Sorry for carelessness, fixed it

Maybe you need to install a brand new python=3.10 environment, then `pip install -e .`

完全可行,你可以按照一门新语言来对待方言数据集。准备千小时以上数据做预训练。