Results 37 issues of zhjygit

Hi sir,this project is great, i connect a gps moudule with gpio 17 and gpio 18, i put maps with (13 14 15 16 resolutions) into sd card. I can...

question
wontfix

my openui is in ubuntu18 vmware workstation like 192.168.1.169,my ollama and models is in physical host like 192.168.1.103. how can i use ollama models in openui of vmware workstation.

Speed is adjustable speed = 1.0 for language, text in texts.items(): model = TTS(language=language, device=device) speaker_ids = model.hps.data.spk2id for speaker_key in speaker_ids.keys(): speaker_id = speaker_ids[speaker_key] speaker_key = speaker_key.lower().replace('_', '-') source_se...

是我进入方式不对吗?怎么里面大部分都没法链接进去。

How to simulate pauses in sound. 如何模拟说话中的停顿或者静音。

感觉很不错,能否添加一下台湾那边口音。 如果您没时间,能否说一下具体可行的方法步骤,我来自己操作一下。 非重重要,期待您的回复。

结合论文来看,主要包括两个大的部分:基于基础语音模型的特征提取和音色克隆; 1)基础语音模型在项目中是哪个呀? 2)guillaumekln/faster-whisper-medium 对应论文中的哪个部分? 3)melotts--myshell-ai-MeloTTS-xxx会在.cache\huggface\hub目录下下载模型,这些模型作用是什么,对应论文哪一部分呀? 目前,在V2版本中,我没找到节奏、停顿等的控制方法,貌似只有speed的控制参数。 对于台湾普通话的克隆,几乎无法实现,不知道是基础语音模型的问题还是其他问题(比如,给的音频质量不行),是否需要训练台湾普通话,如何训练能否提供方法,我也想给这个项目顺便贡献一下自己的力量,让他更丰富。