Yejinzeng
Yejinzeng
噢噢好吧,目前只能控制到1024字节以内是吗? 昨天进行实际测试发现,大模型能输出长文本,但是tts语音播放一半或者在播放一会就直接没有声音了。 请问有文档或者参考链接吗?
噢噢好的,如果我想长期开启小智摄像头的话,是不是需要重新烧录开发板。目前使用过程中,只有通过语音让小智拍照,才会调用self.camare。
1. 我昨天看了sensecap watcher 的方案了,我本身用的是sensecap watcher 的产品。 2. 他的那个方案看着得用串口连模型,要么重新烧录的样子,我自己再尝试一下吧。 3. 顺带催更新一下小智长记忆模式 🐶👉👈@78
我还有个问题,调用原先的摄像头拍照功能,是以base64的形式把图片丢给视觉大模型的 @78
我看源码上,self.camera.take_photo这个是会直接把照片发给视觉大模型,然后返回视觉大模型结果的。 有没有考虑单独把照片单独出来,这样子可以做更多东西了,或者在后端服务那里增加视觉大模型的选择等功能
好的,谢谢虾哥
do you have the docker images for this project?