coze-js web 端的 realtime sdk禁用了打断功能后用户长时间说话超过100多字数后会被强制提交吗？

Apr 01 '25 01:04 tinet-jutt

停顿时间长了，就会被提交

Apr 01 '25 02:04 jackshen310

我们已经给data.turn_detection.silence_duration_ms设置成最大的2000,但是实测下来即使没有停顿但是当说话字数达到100左右时还是会被强制提交

Apr 01 '25 02:04 tinet-jutt

看有没有 logid 给一下，方便我们定位，有个 https://api.coze.cn/v1/audio/rooms 的接口

Apr 07 '25 05:04 jackshen310

logid: "202504090953276DAE80AE6F674397473F"

看有没有 logid 给一下，方便我们定位，有个 https://api.coze.cn/v1/audio/rooms 的接口

Apr 09 '25 01:04 tinet-jutt

logid: "202504090953276DAE80AE6F674397473F"

看有没有 logid 给一下，方便我们定位，有个 https://api.coze.cn/v1/audio/rooms 的接口

想问一下你这边是什么场景，需要长时间说话不停顿的，看有没有其它解决思路。

Apr 10 '25 05:04 jackshen310

logid: "202504090953276DAE80AE6F674397473F"

看有没有 logid 给一下，方便我们定位，有个 https://api.coze.cn/v1/audio/rooms 的接口

想问一下你这边是什么场景，需要长时间说话不停顿的，看有没有其它解决思路。

我们需要针对每句话用智能体做点评，回复不能有中断。目前我们的解决方案是通过客户端vad，录音调用语音转文字发送给智能体，但是这样整个交互响应的流程会拉长

Apr 10 '25 06:04 tinet-jutt

logid: "202504090953276DAE80AE6F674397473F"

看有没有 logid 给一下，方便我们定位，有个 https://api.coze.cn/v1/audio/rooms 的接口

想问一下你这边是什么场景，需要长时间说话不停顿的，看有没有其它解决思路。

我们需要针对每句话用智能体做点评，回复不能有中断。目前我们的解决方案是通过客户端vad，录音调用语音转文字发送给智能体，但是这样整个交互响应的流程会拉长

我们现在有自定义关键字打断的功能，你可以先看下能否解决你的问题，参考：语音对话设定关键词打断

Apr 10 '25 06:04 jackshen310

logid: "202504090953276DAE80AE6F674397473F"

看有没有 logid 给一下，方便我们定位，有个 https://api.coze.cn/v1/audio/rooms 的接口

想问一下你这边是什么场景，需要长时间说话不停顿的，看有没有其它解决思路。

我们需要针对每句话用智能体做点评，回复不能有中断。目前我们的解决方案是通过客户端vad，录音调用语音转文字发送给智能体，但是这样整个交互响应的流程会拉长

我们现在有自定义关键字打断的功能，你可以先看下能否解决你的问题，参考：语音对话设定关键词打断

我们需要的是使用服务端vad的时候不要强制打断

Apr 10 '25 06:04 tinet-jutt

logid: "202504090953276DAE80AE6F674397473F"

看有没有 logid 给一下，方便我们定位，有个 https://api.coze.cn/v1/audio/rooms 的接口

想问一下你这边是什么场景，需要长时间说话不停顿的，看有没有其它解决思路。

我们需要针对每句话用智能体做点评，回复不能有中断。目前我们的解决方案是通过客户端vad，录音调用语音转文字发送给智能体，但是这样整个交互响应的流程会拉长

我们现在有自定义关键字打断的功能，你可以先看下能否解决你的问题，参考：语音对话设定关键词打断

我们需要的是使用服务端vad的时候不要强制打断

这种场景比较少，我们服务端也是依赖火山那边的能力，你这种场景，可能更适合按住说话，由客户端来判断什么时候送给发送给大模型

Apr 11 '25 06:04 jackshen310