ZcChat

一个有长期记忆、表情动作立绘显示和语音功能的ai桌宠

QQ20241115-201211

视频演示：基础功能立绘动画

介绍

特色

拥有长期记忆和可以发展拓展的性格个性
动作和表情显示
立绘动画显示
支持语音输入、对话、唤醒和回复打断
支持语音合成

技术介绍

一图看懂本项目的原理：

快速入门

视频教程

Step 0 - 准备工作

在Release下载并安装ZcChat

在讨论区找到现成的角色数据，当然你也可以自定义角色。

Step 1 - 安装配置Letta

Letta安装教程

启动LettaServer并创建agent。Agent名称、LLM模型、嵌入配置根据自己的需求配置。

Persona填入之前找的现成的角色数据的提示词（核心记忆）。

QQ20241224-201405

Letta地址（如果你没有改过Letta端口，ZcChat默认的就是正确的地址）和AgenctID填入ZcCaht设置，此处必须准确填写。

QQ20241224-201612

Step 2 - （可选）安装配置Vits

方式1：vits-simple-api

Vits安装教程

打开vits，Url和Id填入ZcChat设置。

QQ20241224-201819

方式2：其他语音合成

项目允许使用任意的语音合成工具，首先开启自定义模式。

填入合成的API调用地址，但注意必须输出的是mp3文件，并使用{msg}作为文本的占符位，例如：

http://127.0.0.1:23456/voice/vits?id=0&text={msg}&format=mp3

这个链接访问得到的应该是一个合成出来的mp3文件。

Step 3 - 配置立绘

将角色数据中的立绘放入"/tachie/{名称}"文件夹，并在ZcChat设置中填写{名称}。

最后的项目结构应该是"/tachie/{名称}/开心.png..."

Step 4 -（可选）配置语音输入

方式1：whisper-asr-webservice

whisper-asr-webservice安装教程

将Url填入ZcChat设置。

方式2：百度语音识别

在百度智能云控制台创建短语音识别应用。

将API Key和Secret Key填入ZcChat设置即可。

Step 5 -（可选）配置语音唤醒和打断

观察设置页面中的实时能量，不说话和说话的能量应该会有较大区别，寻找的适合自己的阈值填入设置。

VAD算法写的比较粗糙，所以说语音唤醒和语音打断对环境的要求较大，请仔细配置此项。

F&Q

如何使用其他LLM，如OpenAI、Gemini等

Letta使用不同LLM文档，总的来说就是设置环境变量即可

如何自定义base url，我想用一些第三方的转发，比如说GPT_API_free

添加环境变量OPENAI_API_BASE即可

更新/降级letta后数据库报错，无法启动

一般是letta版本变化有数据库格式改动，如果你不在意数据的话可以尝试删除用户文件夹下的.letta文件夹后重新启动。

参考#1896 #1501

对话不久后会出现格式错误

可能是她忘记了或者是一些误导性的词语篡改了记忆。尝试改进提示词或者用命令的语气告诉她要用正确的格式回复，使其加入记忆。效果如何取决于你使用的模型。我用的是gpt-4o-mini，命令过了一次后就没出现过该问题了。

ZcChat
ZcChat copied to clipboard

Metadata

ZcChat

介绍

特色

技术介绍

快速入门

Step 0 - 准备工作

Step 1 - 安装配置Letta

Step 2 - （可选）安装配置Vits

方式1：vits-simple-api

方式2：其他语音合成

Step 3 - 配置立绘

Step 4 -（可选）配置语音输入

方式1：whisper-asr-webservice

方式2：百度语音识别

Step 5 -（可选）配置语音唤醒和打断

F&Q

如何使用其他LLM，如OpenAI、Gemini等

如何自定义base url，我想用一些第三方的转发，比如说GPT_API_free

更新/降级letta后数据库报错，无法启动

对话不久后会出现格式错误

相关链接

← Metadata

Owner

Metadata

ZcChat ZcChat copied to clipboard

Metadata

ZcChat

介绍

特色

技术介绍

快速入门

Step 0 - 准备工作

Step 1 - 安装配置Letta

Step 2 - （可选）安装配置Vits

方式1：vits-simple-api

方式2：其他语音合成

Step 3 - 配置立绘

Step 4 -（可选）配置语音输入

方式1：whisper-asr-webservice

方式2：百度语音识别

Step 5 -（可选）配置语音唤醒和打断

F&Q

如何使用其他LLM，如OpenAI、Gemini等

如何自定义base url，我想用一些第三方的转发，比如说GPT_API_free

更新/降级letta后数据库报错，无法启动

对话不久后会出现格式错误

相关链接

← Metadata

Owner

Metadata

ZcChat
ZcChat copied to clipboard