Huatuo-Llama-Med-Chinese issues

请问如何基于中文Alpaca大模型进行指令微调？

1

我观察到作者在README 中提到了目前已支持中文Alpaca大模型。但其也是一个 lora 权重，如何在模型里加载两份 lora 权重呢？

SupritYoung

训练数据集的构建

4

请问你们是如何利用GPT3.5的api加本地已有的数据，来构建的训练数据集呢？

yungangwu

如何复现基于Chinese-alpaca-7b的医学知识和医学文献对话模型?

在本地测了Chinese-alpaca-7b + lora-alpaca-med-alldata，在多轮对话上，效果很好。请问： 1. 如何利用llama.json以及liver_cancer.json，如何合并数据集（一个多轮对话，一个单轮对话），直接合并放在一个文件么？ 2. 复现您们的训练效果，该使用哪个模板？('med_template' or 'literature_template.json') 3. 目前我有 8 X A100(40G)， micro_batch_size和batch_size该如何设置（都是64么？为您们设置的一半？） 4. 关于LoRA的rank和alpha值？听说在垂直领域微调时，加大LoRA的rank值效果会好些，想问下您们关于LoRA的rank值以及alpha值的选取的相关经验感谢您们百忙之中抽空解答，祝项目越来越好，感谢！

LouisHeck

如何加入自己的中医医疗数据进行训练

看说明，现在的中医知识库好像都通过ChatGPT-3做了格式转换，有规划其他方式添加训练数据吗？谢谢

zj2050

运行finetune.py 之后，在infer.py阶段有错误

![image](https://github.com/SCIR-HI/Huatuo-Llama-Med-Chinese/assets/51817054/2b4a1398-10d9-47fe-a0c7-774f8bc7a7ba) 请问下图中的两个文件是怎么生成的呢，是直接运行finetune.py得到的吗？ ![image](https://github.com/SCIR-HI/Huatuo-Llama-Med-Chinese/assets/51817054/5f1a152e-1c11-4244-a2ca-614e3d625248) 感谢回答。

YI52KE

4 张 3090 上运行 finetune，运行结束报错 UnboundLocalError: local variable 'load_result' referenced before assignment

14

1. 期望复现 llama lora 使用文中提到的语料库训练； 2. 只修改 finetune.sh 中对应的 base model 路径，其他都未做修改； 3. 运行完之后，命令行报错： ``` he intermediate checkpoints of PEFT may not be saved correctly, using `TrainerCallback` to save adapter_model.bin...

ryzn0518