tinydust18

Results 1 issues of tinydust18

您好,我对这个项目非常感兴趣,并且按照小说抽取的步骤抽取和生成了杨过这一人物形象的text语料和system prompt以及人物的jsonl文件。但是和训练代码中dataloader中加载的文件并不一样,请问应该如何从语料生成可训练数据呢?训练数据中chat_history以及embedding又该如何获取呢?