ChatGLM-Efficient-Tuning icon indicating copy to clipboard operation
ChatGLM-Efficient-Tuning copied to clipboard

即使在训练集上,预测效果也非常差

Open ljch2018 opened this issue 2 years ago • 4 comments

1、训练集loss非常低: 83%|████████▎ | 200/240 [27:39<05:26, 8.16s/it]{'loss': 0.0011, 'learning_rate': 5.367076727981382e-05, 'epoch': 15.05}

2、预测代码: python src/train_sft.py
--do_predict
--model_name_or_path glm/chatglm2-6b
--use_v2
--dataset dataset-cs
--max_source_length 3000
--max_target_length 100
--checkpoint_dir sft/checkpoint-200
--output_dir pred
--per_device_eval_batch_size 2
--predict_with_generate
--fp16

3、预测结果 image

ljch2018 avatar Jun 27 '23 08:06 ljch2018

有数据集吗?我本地复现一下

hiyouga avatar Jun 27 '23 09:06 hiyouga

有数据集吗?我本地复现一下

内部私密数据,不方便发出来。

ljch2018 avatar Jun 27 '23 09:06 ljch2018

之前的预测脚本有 bug,现在已经更新,重新跑一下

hiyouga avatar Jun 27 '23 11:06 hiyouga

1、训练集loss非常低: 83%|████████▎ | 200/240 [27:39<05:26, 8.16s/it]{'loss': 0.0011, 'learning_rate': 5.367076727981382e-05, 'epoch': 15.05}

2、预测代码: python src/train_sft.py --do_predict --model_name_or_path glm/chatglm2-6b --use_v2 --dataset dataset-cs --max_source_length 3000 --max_target_length 100 --checkpoint_dir sft/checkpoint-200 --output_dir pred --per_device_eval_batch_size 2 --predict_with_generate --fp16

3、预测结果 image

现在预测的结果咋样还好吗

LiZhangMing avatar Jun 28 '23 09:06 LiZhangMing