SenseVoice icon indicating copy to clipboard operation
SenseVoice copied to clipboard

SenseVoice生成的文本格式比较乱,没有断句,怎么实现断句的功能呢?

Open wngbob opened this issue 5 months ago • 4 comments

如何实现断句的功能呢?

wngbob avatar Jul 31 '25 09:07 wngbob

Sensevoicesmall打开itn,就顺带会断句了。不过的确有可能会乱,我的做法是关闭itn,然后后面接一个另外的punc模型(参考funasr那边的做法)。不过有一点修改量

majic31 avatar Aug 01 '25 01:08 majic31

Sensevoicesmall打开itn,就顺带会断句了。不过的确有可能会乱,我的做法是关闭itn,然后后面接一个另外的punc模型(参考funasr那边的做法)。不过有一点修改量

punc模型是基于文字语义去断句的吧,在某些情况下效果可能不如sencevoice 直接asr识别的结果。

shanhaidexiamo avatar Sep 03 '25 09:09 shanhaidexiamo

Sensevoicesmall打开itn,就顺带会断句了。不过的确有可能会乱,我的做法是关闭itn,然后后面接一个另外的punc模型(参考funasr那边的做法)。不过有一点修改量

punc模型是基于文字语义去断句的吧,在某些情况下效果可能不如sencevoice 直接asr识别的结果。

嗯嗯,感觉只是可用阶段,真要做好,需要微调的

majic31 avatar Sep 03 '25 11:09 majic31

有办法实现 断句+ 每句话对应原始音频的毫秒数吗?

huicunjun avatar Sep 28 '25 10:09 huicunjun