chaofan comments

Results 117 comments of


                                            chaofan

如何微调最新发布的三个模型呢

感谢您的关注，我们后续会发布技术报告并开源三个模型的微调代码

finetune_for_instruction data.py的理解问题

target指示的是第几个为pos，所以0的意思是第0个为pos

bge-reranker-v2-m3 中文场景的 prompt

训练以及评测多语言时都用的是英文的prompt，所以中文场景继续沿用这个prompt就可以

Normalize Output Scores of bge-reranker to Range 0-1

When you use `compute_score`, you can set `normalize=True`.

在CPU模式下，使用 bge-m3 或bge-large-zh 模型的同一个 BGEM3FlagModel 对象实例在多线程中调用 encode 计算向量会导致计算的向量不正确吗？

只要是同一模型，得到的embedding就会是相同的

请问一下微调bge-reranker-v2-minicpm-layerwise 模型生成的文件，要加载哪个文件夹使用呀？

可以从`merged_model`加载，这个是合并后全参数的模型

想用一个模型，同时对相似查询和文档这两类数据进行排序，会不会出现给的相似问的分数比文档的分数高的情况啊？这种问题要怎么解决呢？

reranker是针对同一query，不同候选passage进行排序的，最好是分开任务进行排序，也可以实际测试一下效果

想请问一下微调bge-reranker-v2-minicpm-layerwise模型过程中，所用的prompt是什么？在哪里看呀～

在训练的数据里，修改prompt这一栏的值就可以

关于llm_instruction_reranker的save方法的问题新

可以直接保存lora参数，后续合并模型就可以合并模型的代码参考： ``` python from FlagEmbedding.llm_reranker.merge import merge_llm merge_llm('google/gemma-2b', 'lora_llm_output_path', 'merged_model_output_paths') ```

TypeError: Gemma2DecoderLayer.forward() missing 1 required positional argument: 'position_embeddings'

可能是`tansformers`版本的问题，可以尝试更换`transformers`的版本解决