ChatLaw icon indicating copy to clipboard operation
ChatLaw copied to clipboard

text2vec数据集构建

Open sz2three opened this issue 1 year ago • 1 comments

看huggingface的例子,例子, text2vec的原始数据看起来像QA问答的数据,请问您是怎么把问答数据构建成为文本embeddings训练的数据的呢,CoSENT的训练是不是需要 (sentence1,sentenc2,sentenc3) 三个样本呢?

sz2three avatar Jul 05 '23 13:07 sz2three

应该是in batch negative方式训的

zzy99 avatar Jul 10 '23 09:07 zzy99