MASR icon indicating copy to clipboard operation
MASR copied to clipboard

语音识别的拼音输出

Open tgarm opened this issue 2 years ago • 3 comments

请问: 有没有支持拼音输出的计划? 或者,如何能方便的输出拼音而非文字?

tgarm avatar Aug 10 '22 05:08 tgarm

没有哦,直接输出文字的,或者英文单词。 你是什么原因需要输出拼音的呢? 或者可以把中文转换为拼音输入到模型训练,应该可以,但是没有对应的语言模型。

yeyupiaoling avatar Aug 10 '22 06:08 yeyupiaoling

谢谢! 这种情况下是否需关闭语言模型?或者无需修改?

tgarm avatar Aug 10 '22 07:08 tgarm

直接使用贪心解码方法就好

yeyupiaoling avatar Aug 10 '22 07:08 yeyupiaoling

我fork了代码,增加了一个pinyin模式,就是将dataset目录下的 manifest.* 和 vocabulary.txt 内的汉字都转换为拼音了。 但这样训练了之后,输出总是很多<unk><unk>,不知道是否遗漏了什么。

tgarm avatar Aug 16 '22 11:08 tgarm

已解决。感谢支持!

tgarm avatar Aug 18 '22 03:08 tgarm

输出什么?不清楚你是怎么改的,很难定位问题。

yeyupiaoling avatar Aug 19 '22 14:08 yeyupiaoling

其实就是汉字的分字和拼音的分字不同。 之前的问题很可能是汉字分字采用的“2字节”一个汉字,而在拼音中,这样就无法对应词汇表中的拼音了。

修改也比较简单,就是增加了按空格分字的模式,并将每个字的最大长度调高。(这样一想,变成英文分词了) 如果有用的话,我生成一个PR。 确实也希望能支持英文识别。

tgarm avatar Sep 03 '22 01:09 tgarm

一直都支持英文识别啊,你看的是最新新代码 吗?

yeyupiaoling avatar Sep 03 '22 01:09 yeyupiaoling