FlagEmbedding issues

finetune是否支持50系显卡

nvidia-5090 cuda12.8 python3.11.7 torch2.7.1+cuda128 If this is not desired, please set os.environ['TORCH_CUDA_ARCH_LIST']. warnings.warn( [rank0]: Traceback (most recent call last): [rank0]: File "/data/miniconda3/envs/emb-ft/lib/python3.11/site-packages/torch/utils/cpp_extension.py", line 2506, in _run_ninja_build [rank0]: subprocess.run( [rank0]: File...

Havedream6

微调后bge-m3每次测试结果都不相同

### 微调脚本 torchrun --nproc_per_node 2 \ -m FlagEmbedding.finetune.embedder.encoder_only.m3 \ --model_name_or_path models/bge-m3 \ --cache_dir ./cache/model \ --train_data ./data/bge-emb.jsonl \ --cache_path ./cache/data \ --train_group_size 8 \ --query_max_len 512 \ --passage_max_len 512 \...

May-Sunshine

Request for releasing the training code for CodeR

Hi, thanks for sharing this great work on CodeR: Towards A Generalist Code Embedding Model! I noticed that the repository currently provides datasets and evaluation scripts, but it doesn’t include...

Foo1szz

如何使用swanlab？

由于wandb的网络问题，想迁移到[swanlab](https://docs.swanlab.cn/guide_cloud/integration/integration-huggingface-transformers.html)来记录实验结果，想知道有没有什么方式能够不改FlagEmbedding源代码的情况下实现？

swpper

bge-reranker-v2-m3再并发场景下报错RuntimeError: Already borrowed

1091492188

BGE-Reranker-Large BUG 报告（评估是否为bug）

你好在测试中，我发现完全相同的文本间关联度，反而略低于语义高度相似但不完全一致的文本。例如：文本 A：“资金流出金额位于 (0,25%] 区间的支出总金额” 文本 A 与自身的关联度为 0.99992736 文本 A与“资金流出金额位于 (0,25%] 区间的支出总笔数” 的关联度为 0.99992745（略高于前者）基于此现象，我产生一个疑问：bge-reranker-large 模型在训练阶段，其数据集中是否未包含 “完全相同文本关联度为 1” 的样本？这是否是导致上述结果的原因？附件中为相关测试的代码截图，供参考。

nanbowan1718