PaddleSpeech icon indicating copy to clipboard operation
PaddleSpeech copied to clipboard

Easy-to-use Speech Toolkit including Self-Supervised Learning model, SOTA/Streaming ASR with punctuation, Streaming TTS with text frontend, Speaker Verification System, End-to-End Speech Translation a...

Results 289 PaddleSpeech issues
Sort by recently updated
recently updated
newest added

there are no single speaker datasets for male, but in multi-speaker tts datasets(aishell3, vctk),there are Male speakers, You can find speaker_id_map.txt in `~/.paddlespeech/models/fastspeech2_aishell3-zh/fastspeech2_nosil_aishell3_ckpt_0.4/speaker_id_map.txt` or `~/.paddlespeech/models/fastspeech2_vctk-en/fastspeech2_nosil_vctk_ckpt_0.5/speaker_id_map.txt` and check the gender of...

Question
T2S

PaddleSpeech语音机器人 🤖 已上线,你可以在这里给陌生人留言,留一句【鼓励】他人的话 👻 ,可以是励志金句,也可以是🌈 屁,可以是你的人生座右铭,也可以是你喜欢的诗词歌句,我们筛选后会放入机器人的【夸夸 🤠 】后台,本活动长期有效,希望我们的机器人能够为你带来一些快乐 🥰 ~ 参与方式:【留言类型】+ 留言内容,留言类型分为【鼓励】与【建议】,【鼓励】中的句子我们筛选后会放入后台,【建议】中的句子为建议留言,我们根据建议,对机器人内容与形式进行调整。🤓 示例一:【鼓励】留言 😝 >【鼓励】你是我见过最可爱的人!爱你! >【鼓励】路漫漫其修远兮,吾将上下而求索!希望你克服万难,勇往直前! 示例二:【建议】留言 🧐 > 【建议】建议增加更多的音色 **添加机器人的方式**: 微信扫码,添加PaddleSpeech机器人微信: **加入PaddleSpeech夸夸群聊**: > **入群注意事项**: > 1. 可以跟机器人互动,也可以跟群里的朋友们一起吹水!但是注意发言,文明和谐友善,不可以发广告,不可以触犯法律底线!请大家发言遵守文明公约!!!👮 > 2....

Stale
Report

版本都对 ![WechatIMG0 1](https://user-images.githubusercontent.com/59203496/181461310-989fbf0e-8ca3-4c5a-9cae-b64aa83fa2a0.png) 的 也有libsndfile1 ![1](https://user-images.githubusercontent.com/59203496/181461423-27b63f81-d290-42ae-85bb-08945a118502.png)

Installation

【这个Issue用于文档问题留言与跟进,开发者们遇到问题的地方以及相关的建议可以在这里进行留言】 PaddleSpeech文档资料 + [【readthedoc】](https://paddlespeech.readthedocs.io/en/latest/) + [【飞桨PaddleSpeech语音技术】](https://aistudio.baidu.com/aistudio/education/group/info/25130) + [【wiki】](https://github.com/PaddlePaddle/PaddleSpeech/wiki) + [【FAQ】](https://github.com/PaddlePaddle/PaddleSpeech/discussions/1989) [【Discussions】](https://github.com/PaddlePaddle/PaddleSpeech/discussions)区也有很多精华内容 目前PaddleSpeech入门教程[【PaddleSpeechStudy】](https://github.com/iftaken/PaddleSpeechStudy)在编写中,大家有想了解的问题或者Demo可以在本Issue下进行留言。

Documentation
Report

运行联合流式语音识别和标点预测很慢 ![图片](https://user-images.githubusercontent.com/94445730/180955793-d41bba23-a97f-47f1-8fb1-56819a428dbc.png)一个40秒的音频要500多秒

Bug
S2T

同样用baker数据集训练 我训练的结果 长文本后半段就异常了 [our_fastspeech2.zip](https://github.com/PaddlePaddle/PaddleSpeech/files/9205043/our_fastspeech2.zip) 你们的fastspeech2预训练模型的结果就是正常的,为什么你们支持的长度比我的长,而数据集是一致的 [paddle_fastspeech2.zip](https://github.com/PaddlePaddle/PaddleSpeech/files/9205044/paddle_fastspeech2.zip)

T2S

对多人对话的音频,想区分不同的人,在哪个时间区间说了什么话。该使用语音分类还是声纹识别呢?如何实现呢?谢谢。

FAQ

https://www.tensorflow.org/tutorials/audio/music_generation 鼓励社区用户给 PaddleSpeech 提交代码

T2S
good first issue

简单的序列预测问题,数据集可以用标贝的文本,其实就是判断每个字后面是否有停顿,如果有的话,是 `#1`~`#4` 中的哪一个,是一个 5 分类的序列预测问题 可以把标贝的文本和 aishell3 的文本结合到一起(但是 aishell3 只有两级停顿,需要考虑一下映射) 实在没有停顿数据的,可以用 MFA 的结果(sp 帧数 > 某个值表示长停顿、< 表示短停顿) 参考 example, [标点预测](https://github.com/PaddlePaddle/PaddleSpeech/tree/develop/examples/iwslt2012/punc0)(BERT ERNIE 直接用 PaddleNLP 的模型,trainer 用 PaddleSpeech 提供的模板,自己需要补充的部分很少) 进阶:多任务的 BERT ![image](https://user-images.githubusercontent.com/24568452/148382039-170504db-dbde-4ade-bcfd-ac2ed484a72c.png)

T2S
good first issue