web 端的 realtime sdk禁用了打断功能后用户长时间说话超过100多字数后会被强制提交吗?
停顿时间长了,就会被提交
我们已经给data.turn_detection.silence_duration_ms设置成最大的2000,但是实测下来即使没有停顿但是当说话字数达到100左右时还是会被强制提交
看有没有 logid 给一下,方便我们定位,有个 https://api.coze.cn/v1/audio/rooms 的接口
logid: "202504090953276DAE80AE6F674397473F"
看有没有 logid 给一下,方便我们定位,有个 https://api.coze.cn/v1/audio/rooms 的接口
logid: "202504090953276DAE80AE6F674397473F"
看有没有 logid 给一下,方便我们定位,有个 https://api.coze.cn/v1/audio/rooms 的接口
想问一下你这边是什么场景,需要长时间说话不停顿的,看有没有其它解决思路。
logid: "202504090953276DAE80AE6F674397473F"
看有没有 logid 给一下,方便我们定位,有个 https://api.coze.cn/v1/audio/rooms 的接口
想问一下你这边是什么场景,需要长时间说话不停顿的,看有没有其它解决思路。
我们需要针对每句话用智能体做点评,回复不能有中断。目前我们的解决方案是通过客户端vad,录音调用语音转文字发送给智能体,但是这样整个交互响应的流程会拉长
logid: "202504090953276DAE80AE6F674397473F"
看有没有 logid 给一下,方便我们定位,有个 https://api.coze.cn/v1/audio/rooms 的接口
想问一下你这边是什么场景,需要长时间说话不停顿的,看有没有其它解决思路。
我们需要针对每句话用智能体做点评,回复不能有中断。目前我们的解决方案是通过客户端vad,录音调用语音转文字发送给智能体,但是这样整个交互响应的流程会拉长
我们现在有自定义关键字打断的功能,你可以先看下能否解决你的问题,参考:语音对话设定关键词打断
logid: "202504090953276DAE80AE6F674397473F"
看有没有 logid 给一下,方便我们定位,有个 https://api.coze.cn/v1/audio/rooms 的接口
想问一下你这边是什么场景,需要长时间说话不停顿的,看有没有其它解决思路。
我们需要针对每句话用智能体做点评,回复不能有中断。目前我们的解决方案是通过客户端vad,录音调用语音转文字发送给智能体,但是这样整个交互响应的流程会拉长
我们现在有自定义关键字打断的功能,你可以先看下能否解决你的问题,参考:语音对话设定关键词打断
我们需要的是使用服务端vad的时候不要强制打断
logid: "202504090953276DAE80AE6F674397473F"
看有没有 logid 给一下,方便我们定位,有个 https://api.coze.cn/v1/audio/rooms 的接口
想问一下你这边是什么场景,需要长时间说话不停顿的,看有没有其它解决思路。
我们需要针对每句话用智能体做点评,回复不能有中断。目前我们的解决方案是通过客户端vad,录音调用语音转文字发送给智能体,但是这样整个交互响应的流程会拉长
我们现在有自定义关键字打断的功能,你可以先看下能否解决你的问题,参考:语音对话设定关键词打断
我们需要的是使用服务端vad的时候不要强制打断
这种场景比较少,我们服务端也是依赖火山那边的能力,你这种场景,可能更适合按住说话,由客户端来判断什么时候送给发送给大模型