PaddleNLP icon indicating copy to clipboard operation
PaddleNLP copied to clipboard

求问AutoModelForSequenceClassification类的原理

Open Ywandung-Lyou opened this issue 2 years ago • 1 comments

paddlenlp.transformers.auto.modeling 源代码中,通过AutoModelForSequenceClassification.from_pretrained函数可以直接载入预训练模型并分类。那么,对于Transformer预训练模型汇总中的模型,输入分类器的句向量是在哪里定义的(非BERT类模型不一定有[CLS]向量),所用的网络结构都是直接在句向量之后接单层全连接网络吗?

Ywandung-Lyou avatar Oct 31 '22 07:10 Ywandung-Lyou

推荐阅读源码帮助理解,比如ERNIE(其他模型也同理) AutoModelForSequenceClassification.from_pretrained('ernie-3.0-medium-zh')则会调用ErnieForSequenceClassification('ernie-3.0-medium-zh'),那么你关注ErnieForSequenceClassification是如何实现。

不是每个模型都支持ForSequenceClassification,具体要看该模型有没有实现对应的ForSequenceClassification模型,大多数情况都是后接全链接层。

lugimzzz avatar Oct 31 '22 12:10 lugimzzz

问题已解决

lugimzzz avatar Nov 15 '22 04:11 lugimzzz