stranger
stranger
和量有关吧?一杯果汁要的水果量多了,吸收的糖分就上去了。糖又是增加风险的。[旺柴]
``` root@81f107f7c720:/workspace/code/models/gptq# CUDA_VISIBLE_DEVICES=0 python3 bloom_inference.py /workspace/models/BELLE_BLOOM_GPTQ_4BIT --wbits 4 --groupsize 128 --load /workspace/models/BELLE_BLOOM_GPTQ_4BIT/bloom7b-2m-4bit-128g.pt --text "this is llama" Loading model ... Done. Human: 介绍一下中国 Assistant: 中国是一个亚洲国家,位于亚洲东部沿海。它是世界上人口最多的国家,拥有着悠久的历史文化和丰富的自然风景资源。中国是世界上最富有文化和历史的国家之一,有着许多著名的文化和历史遗产,如长城、故宫、兵马俑等。中国也是世界上最大的制造业和出口国之一,拥有着许多世界级的公司和品牌。同时,中国也是世界上最大的消费市场之一,拥有着庞大的中产阶级和消费群体。 ------------------------------- Human: 详细介绍一下李白 Assistant: 李白是唐代著名诗人,被誉为“诗仙”。他出生于唐代初期,出生于一个书香门第,擅长诗歌创作。他的诗歌创作内容广泛,包括山水、田园、自然、人生等等。他善于描写自然景物和人类情感,风格豪放,情感深刻,影响了许多后来的诗人。他的代表作品有《将进酒》、《庐山谣》、《夜泊牛渚怀古》等。李白的诗歌风格豪放洒脱,气势磅礴,具有浪漫主义色彩,对后世影响深远。 -------------------------------...
Official document creates overlay network: [use-an-overlay-network-for-standalone-containers](https://docs.docker.com/network/network-tutorial-overlay/#use-an-overlay-network-for-standalone-containers) Then the two containers can realize cross-machine communication through this network, and the rest is password-free login, environment configuration, etc.
我这边A100 40G, max_source_length 512,max_target_length 512,max_steps 1000, 50w条数据需要训练24个小时,真要命
最新代码微调出来的是增量模型,加载的时候是需要带上原始模型的,是不是这个问题导致的呢? 具体可以看下 https://github.com/THUDM/ChatGLM-6B/issues/532 这个issue
玩蛋,一步一步根据官方的例子微调出来的东西已经不能用了。只能回答训练时喂的数据相关问题,不能正常回答其他问题了
一张A100显卡执行train.py 2个半小时就训练完了, 但是设置 CUDA_VISIBLE_DEVICES = 0,1 使用两张A200训练的时候显示要73个小时。。。不明白咋回事
要确认是不是完整的下载了,我是下载的时候出错了。导致加载不成功,重新下了就好了
使用LoRA微调方法不会忘记老知识,可以去 https://github.com/THUDM/ChatGLM-6B/blob/main/PROJECT.md 这里看,有很多基于LoRA微调的项目
1. ImportError: libGL.so.1: cannot open shared object file: No such file or directory 使用 `apt-get update && apt-get install libgl1` 命令解决 2. ImportError: libgthread-2.0.so.0: cannot open shared object file: No...