CasRel-pytorch-reimplement
CasRel-pytorch-reimplement copied to clipboard
请问模型里用到的BERT参与训练了么?
想请教您两个问题:
- 模型中的BERT参与到反向传播了么?还是说只当成Embedding用了呢?
- BERT的输入需要在句子头尾加入[cls]和[spe],如果我在BERT后面接入一个LSTM而不是Linear,那是不是要在BERT的输出中截断这两个位置的向量呢?