Ziqing Yang comments

Results 212 comments of


                                            Ziqing Yang

7B模型跑出来了，答非所问啊，问题出在哪里？

> ![image](https://user-images.githubusercontent.com/21559339/236988480-906e523c-b8db-4d6b-afbd-19a21175cc76.png) > llama+lora同样在胡言乱语，请问如何评判模型的准确度和效果呢？问答使用alpaca，不要用llama

如何在中文 Alpaca 模型的基础上，训练自己的 lora 模型呢？

> @ymcui 目前是还没有开源从原版直接预训练的中文 llama 吗，因为只看到了有LoRA的下载链接我们暂时只有利用LoRA预训练的权重，没有全量参数中文预训练的模型。

如何在中文 Alpaca 模型的基础上，训练自己的 lora 模型呢？

> @airaria ![image](https://user-images.githubusercontent.com/49063302/233043827-836554ed-14f5-4ec0-a2fb-15f220d2d009.png) > > 所以目前这两部的训练都是训练中文的 LoRA 模型吗，没有修改原来 llama 权重 > > 但是你们不是说在原版的 llama 的基础上扩充了中文的词库进行了训练的吗扩充和训练后的embedding和lm head的权重也包括在发布的lora权重里了，所以lora权重才会那么大（～800M）

合并Chinese-Alpaca-Plus不报错，但是运行的时候报错：error loading model: llama.cpp: tensor 'tok_embeddings.weight' has wrong shape; expected [5120 x 32000], got [5120 x 49954]

是不是tokenizer.model忘复制了？

合并Chinese-Alpaca-Plus不报错，但是运行的时候报错：error loading model: llama.cpp: tensor 'tok_embeddings.weight' has wrong shape; expected [5120 x 32000], got [5120 x 49954]

> > 是不是tokenizer.model忘复制了？ > > 复制了，不复制合并不成在运行llama.cpp时也要提供tokenizer，需要把tokenizer拷贝到相应文件夹 ``` llama.cpp/zh-models/ - 7B/ - consolidated.00.pth - params.json - tokenizer.model

无法使用chinese-alpaca-plus-lora-7b进行推理

请提供一下脚本启动参数？

无法使用chinese-alpaca-plus-lora-7b进行推理

inference_hf.py暂不支持从lora权重加载alpaca-plus模型进行推理，如要使用inference_hf.py进行alpaca-plus进的推理，建议先合并模型，流程如下： 1. 使用merge_llama_with_chinese_lora.py合并lora，生成完整的hf格式模型权重： ```bash python merge_llama_with_chinese_lora.py \ --base_model path_to_hf_llama \ --lora_model path_to_chinese_llama_plus_lora,path_to_chinese_alpaca_plus_lora \ --output_type huggingface \ --output_dir path_to_merged_chinese_alpaca_plus ``` 2. 使用inference_hf.py加载合并后的模型进行推理： ```bash python inference_hf.py \ --base_model path_to_merged_chinese_alpaca_plus \ --with_prompt...

alpaca-13b 合并后运行，没有生成内容

generate的参数用`temperature=0.7, top_p=0.95, do_sample=True, num_beams=1, eos_token_id = tokenizer.eos_token_id`试试？

alpaca-13b 合并后运行，没有生成内容

> > @shuiiiiiimu 好的，谢谢，我发现按照generate的参数用temperature=0.7, top_p=0.95, do_sample=True, num_beams=1, eos_token_id = tokenizer.eos_token_id，还是只有 > > 我按照上述的参数设置之后，就能生成了。但是多跑几次之后。生成空白的次数居多（就是，同样的参数，重复跑，有时候有内容输出，有时候没有）。不知道为啥。可以参考scripts/inference_hf.py里的prompt模板。我们测试发现用那个效果会好一些。

关于合并中文token跟原始LLama 的token

我们之前尝试用add_token方法来扩张词汇表发现会切分出许多多余的空格；如果你没有出现此问题，可以尝试继续用add_token方法扩张词汇表，理论上对训练embedding没有影响