FlagEmbedding
FlagEmbedding copied to clipboard
bge-m3的基座模型
您好,想问一下bge-m3的基座模型是什么
您好,bge-m3基座为经过拓展position和retromae预训练后的xlm-roberta-large,可以参考技术报告的附录。 预训练后的模型近期也准备开源出来。
非常感谢您的回复。还有一个问题就是,扩充文本长度到8k的方案用的是什么啊
直接把position embedding加上8192-512个新向量进行训练,新位置向量使用该方法;https://spaces.ac.cn/archives/7947 进行初始化/