chatgpt-on-wechat icon indicating copy to clipboard operation
chatgpt-on-wechat copied to clipboard

语音识别直接使用openai,无法识别

Open xinggonglie opened this issue 1 year ago • 7 comments

前置确认

  • [X] 我确认我运行的是最新版本的代码,并且安装了所需的依赖,在FAQS中也未找到类似问题。

⚠️ 搜索issues中是否已存在类似问题

  • [X] 我已经搜索过issues和disscussions,没有跟我遇到的问题相关的issue

操作系统类型?

Linux

运行的python版本是?

python 3.10

使用的chatgpt-on-wechat版本是?

Master (branch)

运行的channel类型是?

wx(个人微信, itchat)

复现步骤 🕹

印度服务器,ubuntu系统,git clone之后,安装完依赖,使用中转api,https://api.gptapi.us。 1.语音识别填“openai”,发送语音,无法识别,日志如下。 2.安装ffmpeg espeak,语音识别填“google”,gpt-3.5-turbo模型,语音信息,只有文字回复,且回复信息“[ERROR]"开头,换成gpt-4模型,可以正常使用语音信息

问题描述 😯

印度服务器,ubuntu系统,git clone之后,安装完依赖,使用中转api,https://api.gptapi.us。 1.语音识别填“openai”,发送语音,无法识别,日志如下。 2.安装ffmpeg espeak,语音识别填“google”,gpt-3.5-turbo模型,语音信息,只有文字回复,且回复信息“[ERROR]"开头,换成gpt-4模型,可以正常使用语音信息

终端日志 📒

<Start auto replying.
[INFO][2023-12-29 14:33:57][bridge.py:49] - create bot openai for voice_to_text
[INFO][2023-12-29 14:33:58][wechat_channel.py:194] - [WX] sendMsg=Reply(type=ERROR, content=[ERROR]
我暂时还无法听清您的语音,请稍后再试吧~), receiver=@ddd99185cc22fbb68d887462b0960eceaa7c0a6b8579c3d9b8e0a49fd8ae9643
[INFO][2023-12-29 14:34:15][wechat_channel.py:194] - [WX] sendMsg=Reply(type=ERROR, content=[ERROR]
我暂时还无法听清您的语音,请稍后再试吧~), receiver=@ddd99185cc22fbb68d887462b0960eceaa7c0a6b8579c3d9b8e0a49fd8ae9643
^C[INFO][2023-12-29 14:35:23][app.py:17] - signal 2 received, exiting...>

xinggonglie avatar Dec 29 '23 06:12 xinggonglie

只有gpt-3.5-turbo模型有问题,其他gpt-3.5-turbo-1106,gpt-3.5-turbo-16k都以正常发语音

xinggonglie avatar Dec 30 '23 05:12 xinggonglie

只有gpt-3.5-turbo模型有问题,其他gpt-3.5-turbo-1106,gpt-3.5-turbo-16k都以正常发语音

请问你解决了吗?我试了下gpt-3.5-turbo和gpt-3.5-turbo-16k都无法识别语音。

Miykah avatar Jan 04 '24 02:01 Miykah

我用的Gemini 也无法正常识别语音

5high avatar Jan 06 '24 14:01 5high

openai的whisper模型识别成功率太低了,改成使用Google语音识别

xinggonglie avatar Jan 23 '24 11:01 xinggonglie

试了下gpt-3.5-turbo和gpt-3.5-turbo-16k都无法

使用Google(不需要key)或者其他的语音识别api(需要key),openai的语音识别不行

xinggonglie avatar Jan 23 '24 11:01 xinggonglie

同样的问题啊。。困扰很久了

wangluyichen avatar Apr 16 '24 05:04 wangluyichen

试了下gpt-3.5-turbo和gpt-3.5-turbo-16k都无法

使用Google(不需要key)或者其他的语音识别api(需要key),openai的语音识别不行

如何使用谷歌的语音呢?需要在配置文件中添加 什么?

wangluyichen avatar Apr 16 '24 08:04 wangluyichen

语音相关参数配置都在config.py

6vision avatar Aug 01 '24 18:08 6vision