看huggingface的例子,例子, text2vec的原始数据看起来像QA问答的数据,请问您是怎么把问答数据构建成为文本embeddings训练的数据的呢,CoSENT的训练是不是需要 (sentence1,sentenc2,sentenc3) 三个样本呢?
应该是in batch negative方式训的