cywjava comments

Results 91 comments of


                                            cywjava

[BUG/Help] <用自带广告数据P-tuning后，模型原有能力消失>

这个问题一般都是代码造成的。。你可以先更新最新的模型文件，再微调看看。如果还是这样，就是你的代码有问题了

使用lora 训练后无效果的问题

> 如果训练集里的prompt够长够独特，应该能替换的。如果是通用领域，感觉万步是远远不够的。这得多少步啊。。

使用lora 训练后无效果的问题

> 你这新知识进行多轮对话的时候还能记住吗？多轮对话后，会胡说了。。因为他原来里面就一些相似的内容。

解决24G 显存不足的问题，样例代码： ~~~ import os from transformers import AutoTokenizer, AutoModelForCausalLM, AutoConfig import torch PRE_TRAINED_MODEL_PATH = "../model/" # 程序入口 def main(): os.environ["CUDA_VISIBLE_DEVICES"] = "2" tokenizer = AutoTokenizer.from_pretrained(PRE_TRAINED_MODEL_PATH, trust_remote_code=True) tokenizer.pad_token_id = 0...

请问如何实现问答任务

构造成问题，回答内容[CLS]，格式。送进去训练。

我的语料文本很多，能不能分开多个train.json

> 方便问下你用的是哪个分支，以及 train.json 中的数据格式吗 @wujohns 就是用的默认的那个old 分支

跟自己业务有关的模型训练

你这个是问答模型。

cywjava

[BUG/Help] <用自带广告数据P-tuning后，模型原有能力消失>

训练完成后如何验证效果

使用lora 训练后无效果的问题

使用lora 训练后无效果的问题

使用lora 训练后无效果的问题

[Question] 请教下原始训练数据集是否开源？

解决爆24G显存的方法

请问如何实现问答任务

我的语料文本很多，能不能分开多个train.json

跟自己业务有关的模型训练