Chinese-LLaMA-Alpaca icon indicating copy to clipboard operation
Chinese-LLaMA-Alpaca copied to clipboard

我合并+量化了 7B 和 13B 的模型提供给大家下载,并写了使用方法

Open johnlui opened this issue 1 year ago • 22 comments

其实合并和量化都很简单,也很快,但是没人写文档说怎么用😂

下载仓库地址:https://huggingface.co/johnlui/chinese-alpaca-7b-and-13b-quantized

移动本仓库中的llama-7b-hfllama-13b-hf两个文件夹,到你项目的./models文件下即可。该文件夹同时适用于llama.cpptext-generation-webui

johnlui avatar Apr 24 '23 05:04 johnlui

谢谢哥,我部署了好多次都没成,今天突然用 llama.cpp 弄好了,我再看看是哪里合并异常

honglvagan avatar Apr 24 '23 09:04 honglvagan

感谢

PetitPrinceb612 avatar Apr 24 '23 15:04 PetitPrinceb612

谢谢大佬,可以用了。

holycrypto avatar Apr 25 '23 02:04 holycrypto

感谢大佬

mcu13321 avatar Apr 25 '23 02:04 mcu13321

img_v2_4c8bf3a2-557e-4a06-aac6-bca4e54ae42g 13B模型,看着不太聪明的样子

mcu13321 avatar Apr 25 '23 03:04 mcu13321

img_v2_4c8bf3a2-557e-4a06-aac6-bca4e54ae42g 13B模型,看着不太聪明的样子

单看这一段,他说的一点也不错啊

honglvagan avatar Apr 25 '23 03:04 honglvagan

img_v2_4c8bf3a2-557e-4a06-aac6-bca4e54ae42g 13B模型,看着不太聪明的样子

单看这一段,他说的一点也不错啊

img_v2_d1002066-4a92-4361-9965-a60dd1a0509g 那这个呢🤔

mcu13321 avatar Apr 25 '23 03:04 mcu13321

@mcu13321 你测试的输出似乎不是很对劲,有可能模型不完整。😂

image

ymcui avatar Apr 25 '23 03:04 ymcui

@mcu13321 你测试的输出似乎不是很对劲,有可能模型不完整。😂

image

哥,会不会和运行 ./main 的参数有关?我一开始直接用示例的参数,他还是只说英文,我把参数调大他才开始说中文的,我现在用的 ./main -m models/llama-13b-hf/ggml-model-q4_0.bin --color -f prompts/alpaca.txt -ins -c 2048 --temp 1 -n 2048 -t 8 --repeat_penalty 1.3 运行

honglvagan avatar Apr 25 '23 03:04 honglvagan

@mcu13321 你测试的输出似乎不是很对劲,有可能模型不完整。😂 image

哥,会不会和运行 ./main 的参数有关?我一开始直接用示例的参数,他还是只说英文,我把参数调大他才开始说中文的,我现在用的 ./main -m models/llama-13b-hf/ggml-model-q4_0.bin --color -f prompts/alpaca.txt -ins -c 2048 --temp 1 -n 2048 -t 8 --repeat_penalty 1.3 运行

我确认一下,你用的是llama还是alpaca?llama的话一般是用来做续写的,alpaca是用来指令理解(交互)的。 具体你看一下这里:这里

ymcui avatar Apr 25 '23 03:04 ymcui

@mcu13321 你测试的输出似乎不是很对劲,有可能模型不完整。😂 image

哥,会不会和运行 ./main 的参数有关?我一开始直接用示例的参数,他还是只说英文,我把参数调大他才开始说中文的,我现在用的 ./main -m models/llama-13b-hf/ggml-model-q4_0.bin --color -f prompts/alpaca.txt -ins -c 2048 --temp 1 -n 2048 -t 8 --repeat_penalty 1.3 运行

我确认一下,你用的是llama还是alpaca?llama的话一般是用来做续写的,alpaca是用来指令理解(交互)的。 具体你看一下这里:这里

你好!那比如就是“如何快速睡眠”这个中文,请问我应该用llama做好还是alpaca做?

norris9410 avatar Apr 26 '23 11:04 norris9410

@mcu13321 你测试的输出似乎不是很对劲,有可能模型不完整。😂 image

哥,会不会和运行 ./main 的参数有关?我一开始直接用示例的参数,他还是只说英文,我把参数调大他才开始说中文的,我现在用的 ./main -m models/llama-13b-hf/ggml-model-q4_0.bin --color -f prompts/alpaca.txt -ins -c 2048 --temp 1 -n 2048 -t 8 --repeat_penalty 1.3 运行

我确认一下,你用的是llama还是alpaca?llama的话一般是用来做续写的,alpaca是用来指令理解(交互)的。 具体你看一下这里:这里

你好!那比如就是“如何快速睡眠”这个中文,请问我应该用llama做好还是alpaca做?

alpaca

iMountTai avatar Apr 26 '23 13:04 iMountTai

@mcu13321 你测试的输出似乎不是很对劲,有可能模型不完整。😂

image

这个13B的模型跟7B的相比,效果比较差。是merge的时候出了问题吗?有办法验证最终合成的模型是否有问题吗?

我可以再重新合一下模型试试效果。

minlik avatar Apr 26 '23 15:04 minlik

@mcu13321 你测试的输出似乎不是很对劲,有可能模型不完整。😂 image

这个13B的模型跟7B的相比,效果比较差。是merge的时候出了问题吗?有办法验证最终合成的模型是否有问题吗?

我可以再重新合一下模型试试效果。

13B确实比7B效果差,不用怀疑自己,就用7B吧

johnlui avatar Apr 26 '23 16:04 johnlui

@mcu13321 你测试的输出似乎不是很对劲,有可能模型不完整。😂 image

这个13B的模型跟7B的相比,效果比较差。是merge的时候出了问题吗?有办法验证最终合成的模型是否有问题吗? 我可以再重新合一下模型试试效果。

13B确实比7B效果差,不用怀疑自己,就用7B吧

请问这是什么原因呢?根据作者的测试来看,13B应该比7B好一些才对呀。

BoyuGuan avatar Apr 27 '23 03:04 BoyuGuan

This issue has been automatically marked as stale because it has not had recent activity. It will be closed if no further activity occurs. Thank you for your consideration.

github-actions[bot] avatar May 05 '23 00:05 github-actions[bot]

@mcu13321 @BoyuGuan 我前几天更新了 13b 的 config.json 文件,昨天我测试了 13B 模型,发现它的效果确实是比 7B 要好的。在润色文本场景下,Kobold-Liminal Drift 效果最佳。你们可以试试更新我仓库里 13b 文件夹下的 config.json 文件,再用 Kobold-Liminal Drift 测试一下,相信会得到一个好的结果

johnlui avatar May 05 '23 01:05 johnlui

感谢🙏

regaliastar avatar May 06 '23 09:05 regaliastar

@mcu13321 @BoyuGuan 我前几天更新了 13b 的 config.json 文件,昨天我测试了 13B 模型,发现它的效果确实是比 7B 要好的。在润色文本场景下,Kobold-Liminal Drift 效果最佳。你们可以试试更新我仓库里 13b 文件夹下的 config.json 文件,再用 Kobold-Liminal Drift 测试一下,相信会得到一个好的结果 @johnlui 楼主13b,会出现惜字如金的情况,我测试的7b 4-bit的模型,输出很短,即便提示它输出长一些也不行

brealisty avatar May 08 '23 03:05 brealisty

image 不同的答案跟量化模型有关,模型越大回答越详细准确

wood911 avatar May 09 '23 06:05 wood911

请问合并的是 Alpaca 7B plus 版吗

prettyboyweiwei avatar May 12 '23 03:05 prettyboyweiwei

刚试了下应该是 7B 普通版? 35464fb4-00d9-4d61-bff0-d8cbc4a070ca

prettyboyweiwei avatar May 12 '23 06:05 prettyboyweiwei

This issue has been automatically marked as stale because it has not had recent activity. It will be closed if no further activity occurs. Thank you for your consideration.

github-actions[bot] avatar May 19 '23 22:05 github-actions[bot]

Closing the issue, since no updates observed. Feel free to re-open if you need any further assistance.

github-actions[bot] avatar May 23 '23 22:05 github-actions[bot]