PaddleSpeech issues

Results 289 PaddleSpeech issues

Sort by recently updated

TTS 男性音色（Male speaker）

there are no single speaker datasets for male, but in multi-speaker tts datasets(aishell3, vctk)，there are Male speakers, You can find speaker_id_map.txt in `~/.paddlespeech/models/fastspeech2_aishell3-zh/fastspeech2_nosil_aishell3_ckpt_0.4/speaker_id_map.txt` or `~/.paddlespeech/models/fastspeech2_vctk-en/fastspeech2_nosil_vctk_ckpt_0.5/speaker_id_map.txt` and check the gender of...

yt605155624

Question

T2S

【夸夸】留言区

PaddleSpeech语音机器人 🤖 已上线，你可以在这里给陌生人留言，留一句【鼓励】他人的话 👻 ，可以是励志金句，也可以是🌈 屁，可以是你的人生座右铭，也可以是你喜欢的诗词歌句，我们筛选后会放入机器人的【夸夸 🤠 】后台，本活动长期有效，希望我们的机器人能够为你带来一些快乐 🥰 ~ 参与方式：【留言类型】+ 留言内容，留言类型分为【鼓励】与【建议】，【鼓励】中的句子我们筛选后会放入后台，【建议】中的句子为建议留言，我们根据建议，对机器人内容与形式进行调整。🤓 示例一：【鼓励】留言 😝 >【鼓励】你是我见过最可爱的人！爱你！ >【鼓励】路漫漫其修远兮，吾将上下而求索！希望你克服万难，勇往直前！示例二：【建议】留言 🧐 > 【建议】建议增加更多的音色 **添加机器人的方式**：微信扫码，添加PaddleSpeech机器人微信： **加入PaddleSpeech夸夸群聊**： > **入群注意事项**： > 1. 可以跟机器人互动，也可以跟群里的朋友们一起吹水！但是注意发言，文明和谐友善，不可以发广告，不可以触犯法律底线！请大家发言遵守文明公约！！！👮 > 2....

iftaken

Stale

Report

sndfile library not found

版本都对 ![WechatIMG0 1](https://user-images.githubusercontent.com/59203496/181461310-989fbf0e-8ca3-4c5a-9cae-b64aa83fa2a0.png) 的也有libsndfile1 ![1](https://user-images.githubusercontent.com/59203496/181461423-27b63f81-d290-42ae-85bb-08945a118502.png)

laity-slf

Installation

【docs】PaddleSpeech文档问题留言

【这个Issue用于文档问题留言与跟进，开发者们遇到问题的地方以及相关的建议可以在这里进行留言】 PaddleSpeech文档资料 + [【readthedoc】](https://paddlespeech.readthedocs.io/en/latest/) + [【飞桨PaddleSpeech语音技术】](https://aistudio.baidu.com/aistudio/education/group/info/25130) + [【wiki】](https://github.com/PaddlePaddle/PaddleSpeech/wiki) + [【FAQ】](https://github.com/PaddlePaddle/PaddleSpeech/discussions/1989) [【Discussions】](https://github.com/PaddlePaddle/PaddleSpeech/discussions)区也有很多精华内容目前PaddleSpeech入门教程[【PaddleSpeechStudy】](https://github.com/iftaken/PaddleSpeechStudy)在编写中，大家有想了解的问题或者Demo可以在本Issue下进行留言。

iftaken

Documentation

Report

联合流式语音识别和标点预测速度很慢

运行联合流式语音识别和标点预测很慢 ![图片](https://user-images.githubusercontent.com/94445730/180955793-d41bba23-a97f-47f1-8fb1-56819a428dbc.png)一个40秒的音频要500多秒

gfhjjk

Bug

S2T

asr模型可以导出静态图推理吗

njustczr

S2T

为什么你们的fastspeech2的长文本中文合成效果好？

同样用baker数据集训练我训练的结果长文本后半段就异常了 [our_fastspeech2.zip](https://github.com/PaddlePaddle/PaddleSpeech/files/9205043/our_fastspeech2.zip) 你们的fastspeech2预训练模型的结果就是正常的，为什么你们支持的长度比我的长，而数据集是一致的 [paddle_fastspeech2.zip](https://github.com/PaddlePaddle/PaddleSpeech/files/9205044/paddle_fastspeech2.zip)

lawo123

T2S

怎样对多人对话音频，进行说话人区分？

对多人对话的音频，想区分不同的人，在哪个时间区间说了什么话。该使用语音分类还是声纹识别呢？如何实现呢？谢谢。

BeyondLightYear

FAQ

[tts] 复现简单的 music_generation

https://www.tensorflow.org/tutorials/audio/music_generation 鼓励社区用户给 PaddleSpeech 提交代码

yt605155624

T2S

good first issue

[tts] 基于 BERT 实现语音合成文本前端的停顿预测

简单的序列预测问题，数据集可以用标贝的文本，其实就是判断每个字后面是否有停顿，如果有的话，是 `#1`~`#4` 中的哪一个，是一个 5 分类的序列预测问题可以把标贝的文本和 aishell3 的文本结合到一起（但是 aishell3 只有两级停顿，需要考虑一下映射）实在没有停顿数据的，可以用 MFA 的结果（sp 帧数 > 某个值表示长停顿、< 表示短停顿）参考 example, [标点预测](https://github.com/PaddlePaddle/PaddleSpeech/tree/develop/examples/iwslt2012/punc0)（BERT ERNIE 直接用 PaddleNLP 的模型，trainer 用 PaddleSpeech 提供的模板，自己需要补充的部分很少）进阶：多任务的 BERT ![image](https://user-images.githubusercontent.com/24568452/148382039-170504db-dbde-4ade-bcfd-ac2ed484a72c.png)

yt605155624

T2S

good first issue

PaddleSpeech
PaddleSpeech copied to clipboard

Metadata

TTS 男性音色（Male speaker）

【夸夸】留言区

sndfile library not found

【docs】PaddleSpeech文档问题留言

联合流式语音识别和标点预测速度很慢

asr模型可以导出静态图推理吗

为什么你们的fastspeech2的长文本中文合成效果好？

怎样对多人对话音频，进行说话人区分？

[tts] 复现简单的 music_generation

[tts] 基于 BERT 实现语音合成文本前端的停顿预测

← Metadata

Owner

Metadata

PaddleSpeech PaddleSpeech copied to clipboard

Metadata

← Metadata

Owner

Metadata

PaddleSpeech
PaddleSpeech copied to clipboard