wechat4u icon indicating copy to clipboard operation
wechat4u copied to clipboard

语音识别 和 图片特征描述提取

Open stonexer opened this issue 8 years ago • 4 comments

issue 发在这里有点不合适啊,不过也算作 voice-message 和 image-message 事件的 example 吧。展示下能够做到的功能。

大概记录下思路:

语音识别:暂时没找到直接可以处理 MP3 编码的语音识别模块,大致思路是转换成 wav 或其他原始编码,再对接相关 API 获得识别内容。前者可以通过 ffmpeg 或 sox 转换,应该都有 node 的模块,API 目前觉得 baidu 和 google 的各有利弊,再看看吧。

图片特征描述提取: 暂时就考虑用 node-tesseract 和 百度识图 吧

stonexer avatar Apr 06 '16 13:04 stonexer

http://cloudsightapi.com/api 这个api比较6

spacelan avatar Apr 07 '16 11:04 spacelan

66666

stonexer avatar Apr 07 '16 11:04 stonexer

6666666

reverland avatar Apr 07 '16 17:04 reverland

@stonexer 南京工作机会考虑么~

willin avatar Jul 28 '17 00:07 willin