sunzhufeng12345
Results
1
issues of
sunzhufeng12345
我使用官方提供的脚本和数据集先后运行了python pre_tokenize_glm4.py python sort_and_group.py --group_size 8 --train_file /home/hnjj/diskdata/yuanshi/media/szf/llm/glm_longwrite/LongWriter/train/datasets 得到了attention_masks_pack.json ,inputs_pack.npy等文件 运行训练脚本 ./glm4_longwriter.sh 时,遇到与 DeepSpeedZeroConfig 配置相关的 ValidationError。错误是由于 stage3_prefetch_bucket_size 的输入类型无效,期望为整数但接收到浮点数。 训练日志: [2024-08-26 09:58:48,719] [INFO] [comm.py:683:init_distributed] Initializing TorchBackend in DeepSpeed with backend nccl...
bug