FunASR icon indicating copy to clipboard operation
FunASR copied to clipboard

GPU版本 ws里面返回的is_final 一直是false状态

Open fuce1314 opened this issue 1 year ago • 7 comments

a60f3506d696a38b139115fecf78845

我用网页版本的测试"is final" 一直都是false 状态,导致我上传的音频只能一个解析以后,只能刷新页面。语音war 是我上传的文件

fuce1314 avatar Oct 15 '24 01:10 fuce1314

GPU版本目前不支持实时,只有offline模式。

StargazerWayne avatar Mar 21 '25 17:03 StargazerWayne

我cpu版的2pass,每次返回也是始终false。现在就不知道一句话是否说完

Image

byronv5 avatar Apr 24 '25 03:04 byronv5

要客户端主动发送,结束消息。模型才会返回'is_final': True吧。 网页版的客户端是实时的,不会主动发送结束消息。要满足你们的需求,需要自己定制客户端。

StargazerWayne avatar Apr 27 '25 12:04 StargazerWayne

要客户端主动发送,结束消息。模型才会返回'is_final': True吧。 网页版的客户端是实时的,不会主动发送结束消息。要满足你们的需求,需要自己定制客户端。

客户端不知道一句话是否结束了,停顿的判断是vad来判断的。请问你指的消息结束是整个服务断开吗?

byronv5 avatar Apr 29 '25 06:04 byronv5

is_final不是用来判断句子结束的,是用来说明客户端和模型之间的交互是否结束的。

Image 以给出的客户端demo为例,当客户端发送is_speaking = False消息时,表明音频流输入结束时,模型才会发送is_final = True的消息。

StargazerWayne avatar Apr 30 '25 16:04 StargazerWayne

is_final不是用来判断句子结束的,是用来说明客户端和模型之间的交互是否结束的。

Image 以给出的客户端demo为例,当客户端发送is_speaking = False消息时,表明音频流输入结束时,模型才会发送is_final = True的消息。

哦哦,原来如此,我理解错了,一直认为这个是用来判断一句话结束的标识呢!感谢

byronv5 avatar Apr 30 '25 17:04 byronv5

is_final不是用来判断句子结束的,是用来说明客户端和模型之间的交互是否结束的。

Image 以给出的客户端demo为例,当客户端发送is_speaking = False消息时,表明音频流输入结束时,模型才会发送is_final = True的消息。

is_speaking:表示断句尾点,例如,vad切割点,或者一条wav结束 文档又是这么写,这不让人误会么

mrshadowc avatar Sep 17 '25 09:09 mrshadowc