SenseVoice
SenseVoice copied to clipboard
SenseVoice生成的文本格式比较乱,没有断句,怎么实现断句的功能呢?
如何实现断句的功能呢?
Sensevoicesmall打开itn,就顺带会断句了。不过的确有可能会乱,我的做法是关闭itn,然后后面接一个另外的punc模型(参考funasr那边的做法)。不过有一点修改量
Sensevoicesmall打开itn,就顺带会断句了。不过的确有可能会乱,我的做法是关闭itn,然后后面接一个另外的punc模型(参考funasr那边的做法)。不过有一点修改量
punc模型是基于文字语义去断句的吧,在某些情况下效果可能不如sencevoice 直接asr识别的结果。
Sensevoicesmall打开itn,就顺带会断句了。不过的确有可能会乱,我的做法是关闭itn,然后后面接一个另外的punc模型(参考funasr那边的做法)。不过有一点修改量
punc模型是基于文字语义去断句的吧,在某些情况下效果可能不如sencevoice 直接asr识别的结果。
嗯嗯,感觉只是可用阶段,真要做好,需要微调的
有办法实现 断句+ 每句话对应原始音频的毫秒数吗?