zhengxilu

Results 5 comments of zhengxilu

您好,感谢您的关注,我们开放了AndroidControl的训练示例:[dataset](https://huggingface.co/datasets/mPLUG/UI_S1_dataset)。更高质量的训练数据会对训练更有帮助~

有可能是20步test的时候超内存了?可以看一下swanlab的memory曲线排查一下,如果是这个原因的话把val_batch_size再调小一点

这看起来跟test无关,像是在训练第16步开始显存爆炸了,而且是突增而不是周期性,可能的原因是内存泄露。 我提供一个我训练时候的显存周期性变化曲线: 不管是不是内存泄漏,可以尝试的减小显存压力的解法: 1. 再调小BS,BATCH_SIZE=$((WORLD_SIZE * 2)) 2. actor_rollout_ref.actor.fixed_num_mini_batches=2或者1

> 我进一步减少batch_size了,但是训练到20步还是报错了,参数设置和实验perf如下所示,请问有什么解决方法吗: > > ATCH_SIZE=$((WORLD_SIZE * 1)) > > set -x ray stop > > if [ "$RANK" == "0" ]; then # 启动Ray头节点 ray start --head --node-ip-address=$MASTER_ADDR python3 -u...

> 请问跑通了么?这个强化学习为什么没有loss曲线呐 提供一个epsilon为2的示例