libai
libai copied to clipboard
Test mt5
用于交付IDEA的mt5测试bench,不合并
t5:
bash tools/train.sh tools/train_net.py configs/t5_large_pretrain.py 8
mt5
bash tools/train.sh tools/train_net.py configs/t5_large_pretrain_xzp.py 8
为了避免 PR 过大,这个 PR 在 Loss 和 相对性能 正常的情况下,可以先推动合并
为了避免 PR 过大,这个 PR 在 Loss 和 相对性能 正常的情况下,可以先推动合并
好的
merge一下main分支