jane
jane
请问一下,plato中所有的src_id,dest_id是必须从递增编号嘛?就是从0-N
+1
@baichuan-assistant
@staoxiao 辛苦给看一下是不是用的有问题呢?
而且对于一些特殊符号也非常敏感,比如['K Coffee Kot Kaeo', 'So K Cafe']#0.8971559208377049 ['K-Coffee Kot Kaeo', 'So-K Cafe'] #0.1759624741797008
在我的场景,类似'Jc Sweet House', 'Candy House' 这种case,相似度不应该这么高的。而且bge-reranker-large的结果跟之前的bge-m3的差别非常大,bge-m3看上去稍微合理点
优化后的几个版本,关于文本相似度计算的结果都比较离谱,不知道什么原因
@staoxiao 有更新了吗?想知道如何微调
训练两个字符串的相似读,为什么loss 一直都是0.05左右呢?没有明显的下降,合并之后效果也不好。@staoxiao 配置: !torchrun --nproc_per_node 1 \ -m FlagEmbedding.reranker.run \ --output_dir /bge-reranker-v2-m3-finetune \ --model_name_or_path /bge-reranker-v2-m3/bge-reranker-v2-m3 \ --train_data output.jsonl \ --learning_rate 1e-7 \ --fp16 \ --num_train_epochs 5 \ --per_device_train_batch_size 6 \...