chatgpt-web icon indicating copy to clipboard operation
chatgpt-web copied to clipboard

新增了可以支持电脑浏览器的语音输入功能

Open JetsomMa opened this issue 2 years ago • 8 comments

新增了可以支持电脑浏览器的语音输入功能,目前这个能力在手机浏览器上还不能用,尚在努力中,但是感觉希望不大

JetsomMa avatar Apr 01 '23 15:04 JetsomMa

语音输入需要 https 支持吧

Chanzhaoyu avatar Apr 03 '23 00:04 Chanzhaoyu

语音输入需要 https 支持吧

基于web speech api实现语音识别技术的验证信息: 这个方案最大的好处,免费

我验证了,不光需要https支持,还需要梯子:

语音识别的验证结果:1、爬梯子到美国非常好用,且很稳定,但是没有标点符号;2、爬梯子到香港,翻译出来结果会是错的;3、不爬梯子的情况下,压根不能用

语音生成的验证结果:1、爬梯子到美国或香港都能正常使用;2、手机端chrome浏览器下可以使用;不爬梯子不可用!

结论:目前来看,不推荐合并使用。不得不说,我大中华抄作业能力强,但是没有注入灵魂的硬技术。 后续:我对接了科大讯飞的语音识别,目前正在调优【收费的】

JetsomMa avatar Apr 03 '23 12:04 JetsomMa

语音输入需要 https 支持吧

基于web speech api实现语音识别技术的验证信息: 这个方案最大的好处,免费

我验证了,不光需要https支持,还需要梯子:

语音识别的验证结果:1、爬梯子到美国非常好用,且很稳定,但是没有标点符号;2、爬梯子到香港,翻译出来结果会是错的;3、不爬梯子的情况下,压根不能用

语音生成的验证结果:1、爬梯子到美国或香港都能正常使用;2、手机端chrome浏览器下可以使用;不爬梯子不可用!

结论:目前来看,不推荐合并使用。不得不说,我大中华抄作业能力强,但是没有注入灵魂的硬技术。 后续:我对接了科大讯飞的语音识别,目前正在调优【收费的】

哈哈,其实这个我很早就研究了下,甚至还有语音输出,但是限制太多。

Chanzhaoyu avatar Apr 03 '23 13:04 Chanzhaoyu

@Chanzhaoyu 我是V站的,刚特别关注你,我也在研究语音输入和语音输出 @JetsomMa 持续关注中,科大讯飞的也可以,如果有语音输出就更好了

GeorgeGalway avatar Apr 06 '23 06:04 GeorgeGalway

@Chanzhaoyu 我是V站的,刚特别关注你,我也在研究语音输入和语音输出 @JetsomMa 持续关注中,科大讯飞的也可以,如果有语音输出就更好了

语音识别已经有了,我对接了腾讯云的语音识别,现在还没能解决app key安全问题,体验地址:https://chat.mashaojie.cn/ 后续可以以脚本引入+密钥激活的方式接入 已有思路,等有时间了完善

JetsomMa avatar Apr 07 '23 09:04 JetsomMa

为什么不直接使用OpenAI的 Whisper AI呢?

BertramRay avatar Apr 07 '23 11:04 BertramRay

为什么不直接使用OpenAI的 Whisper AI呢?

只是为了能通过websocket实现实时语音识别,而不是录一段录音发送上去让他识别

JetsomMa avatar Apr 10 '23 07:04 JetsomMa

这个分支如果要继续的话,需要适当的rebase(变基)操作,它里面出现了一些其他的PR里已经合过的代码。

liut avatar Apr 24 '23 16:04 liut