RAREMed
RAREMed copied to clipboard
预训练的顺序是先NSP,再MASK吗?
这会不会导致模型对NSP的遗忘问题?