xutao
xutao
@laodi-chen 这个具体的原因是由于 i2s set clk 的时候 i2s 驱动关了 DMA 导致的。以下有几个方案 1. 让 app_main 的 task 优先级高于 i2s stream(i2s_stream 默认的23),确保I2S 的数据在 set clk 之后 write 2. 使用 rsp 的方式, 不使用 set...
1. 如果vad 使能了,那么说话时可以触发 vad 的 (唤醒模式默认 vad 是) [link code](https://github.com/espressif/esp-adf/blob/894a483eab7ef4868baa2865e7b16fca28b2b381/examples/ai_agent/volc_rtc/components/audio_processor/audio_processor.c#L360) 2. 唤醒模式 没有办法去掉唤醒词, 你可以应用处理了
那就只使能 VAD 就可以了, 其他的全都 [disable](https://github.com/espressif/esp-adf/blob/583205a9d108e23330285a99a030b90184d2a249/examples/speech_recognition/wwe/main/main.c#L339)
@jimforr @sourxsunny 现在的版本不会有这个问题了,因为这块代码是开出来的
Hi @Freak-luo ,感谢反馈 初步先如下修改,后面我们会出正式版本 ```C diff --git a/examples/ai_agent/coze_ws_app/main/audio_processor.c b/examples/ai_agent/coze_ws_app/main/audio_processor.c index 4469f9f47..8884b7ea7 100644 --- a/examples/ai_agent/coze_ws_app/main/audio_processor.c +++ b/examples/ai_agent/coze_ws_app/main/audio_processor.c @@ -842,7 +842,10 @@ static int playback_inport_acquire_read(void *handle, esp_gmf_data_bus_block_t * _blk.buf_length = blk->buf_length; int...
这个可以先按照 [火山文档](https://www.volcengine.com/docs/6348/1315561)配置。 如果还有问题, 可以进[实时对话式AI嵌入式硬件交流群](https://bytedance.larkoffice.com/docx/TEMCdrJ3VouilPxSpjbc6CyUnAh)咨询一下
试一下 FLASH/PSRAM 改为 80M看看
`opus_cfg.out_rb_size = 16 * 1024; ` 这个buffer 有点大了, 你改为 512 试试
3 秒是怎么计算的呢, 整个buffer' 应该都缓存不了 3 s 的数据的