Chat-Haruhi-Suzumiya
Chat-Haruhi-Suzumiya copied to clipboard
Chat凉宫春日, An open sourced Role-Playing chatbot Cheng Li, Ziang Leng, and others.
关于模型base,3个问题麻烦请教下~ 1. 看了klon中的lora训练推理代码,我理解模型选择的chatglm2_lora base,是在chatglm2上基于silk-road/Chat_Suzumiya_Fusion数据集微调的的lora;但是Chat_Suzumiya_Fusion中只包括部分人物数据,生成一个新的人物,是直接抽取system prompt和对话记录后进行few-shot+知识库输出结果,还是需要将数据加入Chat_Suzumiya_Fusion数据重新训练呢? 2. 形成模型输入格式:system prompt + story + history,Chat_Suzumiya_Fusion数据中应该只有前两个部分吧如下图,所以history在训练中没有,是推理中直接append上的,模型会将其作为story的一部分来理解?故事和历史的最大长度可以达到1500和1200,默认模型最大输入是2048?  3. 英文数据silk-road/ChatHaruhi-from-RoleLLM中直接保存文本和向量了,这块的处理是只用到了ZenMoore/RoleBench中的profile数据而没用instructions数据吗?处理后的数据好像也不是直接按照diag_id进行划分的,想具体了解下处理逻辑,基于llama2训练个base,test几个英文人物~
在[《Generative Agents: Interactive Simulacra of Human Behavior》](https://arxiv.org/abs/2304.03442)中,作者对智能体的记忆做了一些特殊的处理,所有记忆都按时间进行组织,在取回记忆时,需要同时计算时间衰减因子、重要性和余弦相似度。同时,还通过Reflection机制形成记忆树,方便智能体产生抽象认识。在模拟的小镇环境中,智能体似乎已经具有了一定程度上的长期记忆。这套方法对本项目是否有借鉴意义呢?
## 一, 推理后一次性返回数据 当前项目下语言模型的调用(适当修改后), 可以做到推理后全量返回. 但是也有些许问题, **使用本地模型时, 会有很多轮对话导致等待时间过长.** ```python # if not "OPENAI_API_KEY" in os.environ.keys(): # # 使用第三方的语言模型 # if JinaChat_Key: # # chat = ChatOpenAI(temperature=0, # # openai_api_key=self.api_key, #...
As a big fan of anime, I would like to make some academic contribution to the field of character cosplay, and I am currently in search of a suitable research...
模型对话突然无论问什么,后面一直回答同一个答案,无法纠正,这个要怎么改进?(感觉是因为history延长后,后面一直反复这个记录,成了死循环模型就不能正常chat了)
比如说我现在有一整本凡人修仙传,我改怎么生成韩立这个人物?制作步骤又是什么呢?求教
我很开心能够找到这么一个非常有趣的项目。前些日子我一直在尝试使用RWKV方面的网文模型,今天我看到这里有一个自动抽取小说结构的这么一个工作 ,感到非常激动。下面是我的一些疑问: 该工具可以单独拿出来抽取得到数据,然后我基于自己的模型去微调吗,还是说需要在ChatHaruhi中载入才可以? ChatHaruhi的一些基础工作,比如前端,多模态demo有没有教程可以进行学习? 另外我对火星引力的小说比较感兴趣 比如 《逆天邪神》,《网友之邪龙逆天》等等,不知道制作组有没有考虑过将其加入work list中。或者如果可以的话,我能够做些什么来参与到这个项目或者社区建设中呢
这里我保存了wav音频格式,怎么实现加载到gradio界面播放呢
主要是两个不解的地方: 1. 有时候会有连着好几句都是同一个角色的话,这种如何处理成对话的格式? 2. 旁白是如何处理的?
電影例如:鋼鐵俠 或 维吉妮雅·“小辣椒”·波兹 遊戲例如:崩壞3 的西琳