sunsky89757
sunsky89757
优化建议
 此处目前实现方式是共享预设,可否做成每个对话独享形式?这样对话内容可以作为单独的案例长期存储使用。
 大佬这里只显示获取中,无法复制到seed,我使用的vercel部署。
大佬您好,有这样一个需求场景您看看是否有实现的可能,目前市面上基本上看不到这样的项目: 类似于微信里的语音聊天(非实时): 我们将打字模式切换为语音输入模式,长按语音输入开始说话,结束长按后,用户输入的语音内容会通过whisper转换为文字并传输给gpt模型(注意,这个转换过程是隐藏传输的,用户在界面上并不能看到语音转换后的文字部分,除非它点击自己的语音并手动显示文字)。之后gpt接收用户文字后回答(无需流式传输),回答完成后自动调用tts并转换为语音自动播放给用户(这个转换过程也是隐藏传输的,用户也是看不到gpt回答的文字,而只能收到最终tts转换的语音)。 这样就实现了类似于微信里的语音聊天功能(非实时)功能。 这其中有一个不好的体验就在于用户在收到回答前的等待期过长,是否还可以考虑采用tts流式回传方式解决,这个官方目前是支持的。 
### 💻 Operating System Windows ### 📦 Environment Official Preview ### 🌐 Browser Chrome ### 🐛 Bug Description  如图 ### 🚦 Expected Behavior _No response_ ### 📷 Recurrence Steps...
项目不能跑,不如删掉