ChatLaw text2vec数据集构建

text2vec数据集构建

Open sz2three opened this issue 1 year ago • 1 comments

看huggingface的例子，例子， text2vec的原始数据看起来像QA问答的数据，请问您是怎么把问答数据构建成为文本embeddings训练的数据的呢，CoSENT的训练是不是需要（sentence1,sentenc2,sentenc3）三个样本呢？

Jul 05 '23 13:07 sz2three

应该是in batch negative方式训的

Jul 10 '23 09:07 zzy99