SSAN
SSAN copied to clipboard
模型结构和加载预训练模型时候不太懂
你好,模型编码层中是根据sij选的不同的参数,做q*k的时候加的偏置不同吗?还有加载预训练模型的时候是对bert或robert结构相同的对应的部分加载参数了吗,想不到如何加载预训练模型的?还有模型中用的结构的依赖是两个相邻的句子间的实体结构依赖吗?谢谢您的回答!
你好,模型编码层中是根据sij选的不同的参数,做q*k的时候加的偏置不同吗?还有加载预训练模型的时候是对bert或robert结构相同的对应的部分加载参数了吗,想不到如何加载预训练模型的?还有模型中用的结构的依赖是两个相邻的句子间的实体结构依赖吗?谢谢您的回答!
1.是的,根据s_ij来选取对应的网络参数
2.BERT / RoBERTa本来的模型部分是仍然保留的,这部分会自动load,新增的Transformation module没有对应的Pretrained参数,所以是重新初始化的
3.结构的依赖具体(启发式地)引入了几种,可参考论文中关于S, s_ij的描述,既有同一句子内的,也有相邻句子间的,也有共指mention间的