KyrieMing comments

Results 18 comments of


                                            KyrieMing

Adds a script to convert NeoX 2.0 checkpoints to DeepSpeed's universal checkpoint format

@dashstander Hello, which version of deepspeed does this PR requests? I am using deepspeed 0.8.2 as gpt-neox2.0 suggests, run deepspeed_to_deepspeed.sh have following erros: ``` deepspeed 0.8.2 fatal: not a git...

Adds a script to convert NeoX 2.0 checkpoints to DeepSpeed's universal checkpoint format

@dashstander I am using this Deepspeed [PR](https://github.com/EleutherAI/DeeperSpeed/pull/47), then I run deepspeed_to_deepspeed.sh, the error comes: ``` Convert DeepSpeed Checkpoint to DeepSpeed Checkpoint args = Namespace(config='/mnt/resources/checkpoints-neox2.0-6b-4096-256GPUs/global_step20000/configs/1-3B.yml', input_folder='/mnt/resources/checkpoints-neox2.0-6b-4096-256GPUs', output_folder='/mnt/resources/checkpoints-neox2.0-6b-4096-256GPUs-6dp', target_dp=48, target_pp=1, target_tp=1) Converting...

KyrieMing

Adds a script to convert NeoX 2.0 checkpoints to DeepSpeed's universal checkpoint format

Adds a script to convert NeoX 2.0 checkpoints to DeepSpeed's universal checkpoint format

Adds a script to convert NeoX 2.0 checkpoints to DeepSpeed's universal checkpoint format

Adds a script to convert NeoX 2.0 checkpoints to DeepSpeed's universal checkpoint format

Adds a script to convert NeoX 2.0 checkpoints to DeepSpeed's universal checkpoint format

Adds a script to convert NeoX 2.0 checkpoints to DeepSpeed's universal checkpoint format

[BUG] CUDA error: an illegal memory access was encountered with Adam optimizer on H100

feat: prompt caching