Biały Wilk comments

Results 21 comments of


                                            Biały Wilk

你好，能给我分享一个训练好的语言模型吗，训练的太慢了，效果也不好，blog的网盘分享的模型下载不了

+1，百度网盘已经被河蟹了

[BUG/Help] <title>有没有大神试过大batch的微调

> per_device_train_batch_size太小了，调到100试下。你一个卡多少显存卡不行，A10。。。。带不动100，FP16，最大到4，现在堆了8张卡，分布式跑吧

[BUG/Help]如何对chatglm-6b进行RLHF，有相关的代码实现吗？

微软的deepspeed-chat，改改代码应该可以支持吧

[BUG/Help] <title>deepspeed加载模型，需要什么样的配置？4卡v100，v100是32g的，没有跑起来

情况和这个相同么？ https://github.com/THUDM/ChatGLM-6B/issues/592#event-9003274415

[Help] <ptuning时使用了多少条数据获得了较好的效果>

试过2W的诗歌创作数据，效果已经很不错了

用ptv2微调，多卡跑，为啥第一张卡显存占满了，报oom

第一张卡应该有很多进程，看网上说是torch.load的锅，但是改了之后，依然这样，是框架哪里问题？

用ptv2微调，多卡跑，为啥第一张卡显存占满了，报oom

如果第一张卡有太多进程占用显存，检查下你是不是从git安装的transformers，不能装最新的4.29.0.dev，这个版本就会出现核0多出来3个进程

```python import bitsandbytes as bnb from transformers import ( AutoConfig, AutoTokenizer, AutoModel, set_seed, BitsAndBytesConfig ) import torch from peft import ( prepare_model_for_kbit_training, LoraConfig, get_peft_model, get_peft_model_state_dict, PeftModel ) compute_dtype = torch.bfloat16...

[BUG/Help] <title> Qlora不支持么？

必须使用 transformers==4.30.2，从源代码安装的transformers==4.31.0.dev0是不行的