wechat4u
wechat4u copied to clipboard
语音识别 和 图片特征描述提取
issue 发在这里有点不合适啊,不过也算作 voice-message 和 image-message 事件的 example 吧。展示下能够做到的功能。
大概记录下思路:
语音识别:暂时没找到直接可以处理 MP3 编码的语音识别模块,大致思路是转换成 wav 或其他原始编码,再对接相关 API 获得识别内容。前者可以通过 ffmpeg 或 sox 转换,应该都有 node 的模块,API 目前觉得 baidu 和 google 的各有利弊,再看看吧。
图片特征描述提取: 暂时就考虑用 node-tesseract 和 百度识图 吧
http://cloudsightapi.com/api 这个api比较6
66666
6666666
@stonexer 南京工作机会考虑么~