CLUE 请问roberta为什么全采用BertConfig, BertForSequenceClassification, BertTokenizer？

请问roberta为什么全采用BertConfig, BertForSequenceClassification, BertTokenizer？

Open charlesfufu opened this issue 4 years ago • 2 comments

请问roberta为什么全采用BertConfig, BertForSequenceClassification, BertTokenizer？为什么不采用RobertaConfig, RobertaForSequenceClassification, RobertaTokenizer？之间有什么区别吗

Dec 14 '20 02:12 charlesfufu

同问

Feb 03 '21 08:02 chenjun0210

因为中文版的RoBERTa相比于BERT使用了更多数据和不同的训练方法但模型结构相同。模型主页有说明： https://github.com/ymcui/Chinese-BERT-wwm

Feb 11 '21 08:02 lczhang06

CLUE CLUE copied to clipboard

请问roberta为什么全采用BertConfig, BertForSequenceClassification, BertTokenizer？

CLUE
CLUE copied to clipboard