CosyVoice icon indicating copy to clipboard operation
CosyVoice copied to clipboard

希望可以有上传音频文件克隆声音的功能

Open redstoneleo opened this issue 1 year ago • 7 comments

希望可以有上传音频文件克隆声音的功能,比如说我看到动画片里的某个角色的声音我比较喜欢,我就截取一段声音上传克隆这个声音——这就是我想要的

redstoneleo avatar Jul 08 '24 14:07 redstoneleo

现在web端就可以,我刚用wav文件音频测试过

qazwsx921028 avatar Jul 09 '24 00:07 qazwsx921028

@redstoneleo 我做了一个Colab在线使用,支持本地上传音频文件,教程视频在这里

KevinWang676 avatar Jul 09 '24 04:07 KevinWang676

@KevinWang676 大佬出错了 Error [ONNXRuntimeError] : 6 : RUNTIME_EXCEPTION : Non-zero status code returned while running Add node. Name:'/Add_2' Status Message: /onnxruntime_src/onnxruntime/core/providers/cpu/math/element_wise_ops.h:560 void onnxruntime::BroadcastIterator::Append(ptrdiff_t, ptrdiff_t) axis == 1 || axis == largest was false. Attempting to broadcast an axis by a dimension other than 1. 1500 by ……

测试文件 https://drive.google.com/drive/folders/1EQUjVpubolPUSjGzQc35vPCs2bYuluu8?usp=sharing

redstoneleo avatar Jul 10 '24 08:07 redstoneleo

@qazwsx921028 你哪里的web端啊?可以发个网址并截图我看看吗?

redstoneleo avatar Jul 11 '24 01:07 redstoneleo

@qazwsx921028 你哪里的web端啊?可以发个网址并截图我看看吗?

写了个flask接口,支持上传音频,可以参考

https://blog.csdn.net/weixin_42357472/article/details/140321056

lonngxiang avatar Jul 11 '24 01:07 lonngxiang

@lonngxiang CSDN收费订阅才能看?

MTD-xiaoma avatar Jul 11 '24 02:07 MTD-xiaoma

@lonngxiang 可以开放个接口我们体验一下效果吗?效果好的话也自己弄一个

redstoneleo avatar Jul 11 '24 02:07 redstoneleo