kiron111
kiron111
Because I have to transcribe multiple audio/ video files each time, it's not so convenient to click and wait a file to finish. Thank you for your development of such...
for example: 1 00:00:00,000 --> 00:00:02,000 I'm not sure if I'm going to be able to get through this. 2 00:00:02,000 --> 00:00:04,000 I'm not sure if I'm going to...
會支持粵語嗎?
### Is your feature request related to a problem? 如題,謝謝 ### Describe the solution you'd like. _No response_ ### Describe alternatives you've considered. _No response_ ### Additional context. _No response_
就是單純快速配一段短片,不想聲音每次訓練一個 加人一個純配口形的功能 謝謝!!
### 是否已存在类似问题? - [x] 我已搜索现有问题 ### 当前行为 我是window 11, 用docker 部署版本 1.2.5 (用Pexel 是能成功合成的,), 但用自己上传的图片,程式是能生成"图片生成的视频",但合成一个无声音完整片段combined-1.mp4,就说没找到片段合成,然后报错 ### 预期行为 正常是会合成combined-1.mp4 ### 重现步骤 但用自己上传的图片 ### 堆栈追踪/日志 ``` ## preprocess local materials 2025-05-09 15:54:30.911...
### 是否已存在类似的功能请求? - [x] 我已搜索现有的功能请求 ### 痛点 建议可增加功能,可女以接上Kokoro-TTS api 的项目 https://github.com/PierrunoYT/Kokoro-TTS-Local 这应该是开源tts 中,最不讲究性能的一款, 用GPU 几秒可生成一分钟的朗读音频,用CPU 也就长一点 (跟edge tts差不多吧) 有高低抑扬顿挫,不太机械声(中文/普通话都适配) ### 建议的解决方案 项目有gradio 功能, 应该可以用api 调用 单独部署也可适用 ### 有用的资源 https://github.com/PierrunoYT/Kokoro-TTS-Local ###...
### 需求描述 | Problem Statement 有時使用某些 tts 比较适合用戶自己,項目也无法适配所有api 的格式 (有些tts 也存在抽卡成份,也不可能整个项目产出影片,才回头做) 可否加设个功能,就使自己上载已合成的语音? 比较有弹性 Sometimes some tts are more suitable for the user, and the project can't adapt to all api...
Supporting api, access chatbox/cherry gradio to be available; So thant it is convenient to arrange a mnn for all the spare devices in the home. Thanks
### Prerequisites - [x] I am running the latest code. Mention the version if possible as well. - [x] I carefully followed the [README.md](https://github.com/ggerganov/llama.cpp/blob/master/README.md). - [x] I searched using keywords...