wechat4u 语音识别和图片特征描述提取

语音识别和图片特征描述提取

Open stonexer opened this issue 8 years ago • 4 comments

issue 发在这里有点不合适啊，不过也算作 voice-message 和 image-message 事件的 example 吧。展示下能够做到的功能。

大概记录下思路：

语音识别：暂时没找到直接可以处理 MP3 编码的语音识别模块，大致思路是转换成 wav 或其他原始编码，再对接相关 API 获得识别内容。前者可以通过 ffmpeg 或 sox 转换，应该都有 node 的模块，API 目前觉得 baidu 和 google 的各有利弊，再看看吧。

图片特征描述提取：暂时就考虑用 node-tesseract 和百度识图吧

Apr 06 '16 13:04 stonexer

http://cloudsightapi.com/api 这个api比较6

Apr 07 '16 11:04 spacelan

66666

Apr 07 '16 11:04 stonexer

6666666

Apr 07 '16 17:04 reverland

@stonexer 南京工作机会考虑么~

Jul 28 '17 00:07 willin