ReCO
ReCO copied to clipboard
请问训练albert_xxlarge时超参如何设置
您好,我在ReCo上用xx_large训练的时候发现模型的loss一直不下降,请问您的超参数是如何设置的?是否加了warmup,dropout等策略?