MaChi
MaChi
### Is your feature request related to a problem? Please describe. 谢谢你,我的清华科学家们 ### Solutions 就是国外的数据集有非常棒的,或者那些数据集翻译成中文,可以作为中文数据集呢, 毕竟翻译模型目前已经可以达到信达雅的境界了~ ### Additional context _No response_
what language does GraphRAG support? Can I use Japanese document to do RAG?
When will this code be released? When will this code be released? When will this code be released? When will this code be released?
### 提交前必须检查以下项目 - [X] 请确保使用的是仓库最新代码(git pull) - [X] 已阅读[项目文档](https://github.com/ymcui/Chinese-LLaMA-Alpaca-3/wiki)和[FAQ章节](https://github.com/ymcui/Chinese-LLaMA-Alpaca-3/wiki/常见问题)并且已在Issue中对问题进行了搜索,没有找到相似问题和解决方案。 - [X] 第三方插件问题:例如[llama.cpp](https://github.com/ggerganov/llama.cpp)、[text-generation-webui](https://github.com/oobabooga/text-generation-webui)等,建议优先去对应的项目中查找解决方案。 ### 问题类型 模型训练与精调 ### 基础模型 Llama-3-Chinese-8B(基座模型) ### 操作系统 Linux ### 详细描述问题 ``` # 请在此处粘贴运行代码(请粘贴在本代码块里) ``` 因为需要做某个垂直领域的llama3,由于包含很多专有词汇,直接做指令微调效果甚微。 所以想请教一下如何做增量预训练。或者其他可以让llama3更适合某一专业领域的训练方法。 ###...