InternVL
InternVL copied to clipboard
学习率导致同一任务的不同子任务收敛情况不同问题请教
作者您好,我的任务需要模型同时进行ocr+定位,当我设置较大的学习率(4e-5)的时候ocr会出现很多错别字但定位能力能学的比较好,当我设置较小的学习率(1e-5/1e-6等)的时候ocr不会有错别字但定位能力难以拟合,请问有什么其他的方法来平衡这两个能力吗