CLUEPretrainedModels
CLUEPretrainedModels copied to clipboard
RoBERTa-tiny-clue 和RoBERTa-tiny-pair的异同
请问,这两个超小型模型有什么不同吗,RoBERTa-tiny-pair 支持输出一个句子的向量,然后再通过计算余弦的方式来计算相似度吗,还是只能输入两个句子,通过分类的方式判断二者是否相似,如果是后者的话,易用性和扩展性上是否不及前者的方式,请大佬指教!
RoBERTa-tiny-pair也能和正常的预训练模型一样用的,只是它在句子对任务上效果可以更好一些。
句子队任务的RoBERTa-tiny-pair的ckpt文件里面为什么没有pool层出口处的(312,2)的张量权重呢?