FastBERT icon indicating copy to clipboard operation
FastBERT copied to clipboard

如何确定distill阶段的early stopping

Open yangshao opened this issue 3 years ago • 0 comments

现在distill阶段使用的是固定的speed和epochs, 而且没有做early stopping. 对于不同的数据集, 如何确定这些超参数,已经如何选取最终的模型?

yangshao avatar Oct 08 '20 13:10 yangshao