FlagEmbedding
FlagEmbedding copied to clipboard
关于batch_size的计算方式
您好,论文里提到的batch_size=19200,指的是Device_num X per_device_batch_size X accumulation_steps这样计算出来的结果吗
您好,是Device_num X per_device_batch_size,我们没有开启accumulation_steps。
您好,多谢您的回复,还想再问一下stage1训练时train_group_size您是设置成多少的