Linly 增量预训练超参数设置

增量预训练超参数设置

Open jamestch opened this issue 1 year ago • 2 comments

我计划在20G左右的领域数据（约9B token）上做增量预训练 learning_rate max_seq_length total_steps save_checkpoint_steps …… 等超参数设置有啥推荐吗？训练中文LLaMA大规模语言模型中的如下： deepspeed pretrain.py --deepspeed --deepspeed_config models/deepspeed_config.json
--pretrained_model_path models/llama-7b.bin
--dataset_path dataset.pt --spm_model_path $LLaMA_7B_FOLDER/tokenizer.model
--config_path models/llama/7b_config.json
--output_model_path models/output_model.bin
--world_size 8 --learning_rate 1e-4
--data_processor lm --total_steps 10000 --save_checkpoint_steps 2000 --batch_size 24

Apr 14 '23 08:04 jamestch

您好，请问下对于这个数据量，使用了几块GPU，总共多大显存+内存呢？请大佬指教，谢谢！

May 17 '23 09:05 PL2584718785

这个10000的steps，batch_size 24都跑不完你的数据集吧

Jun 06 '23 09:06 AI-Study-Han

Linly Linly copied to clipboard

增量预训练超参数设置

Linly
Linly copied to clipboard