FlagEmbedding
FlagEmbedding copied to clipboard
qwen2.5-0.5B作为基座使用flagembedding-decoder_only脚本训练embedding模型
这个是我的训练脚本,同一分数据,我微调zh-v1.5-bge-small,在验证集效果更好,为什么qwen0.5B参数量不是更大吗,求指点哪里出了问题
数据量是多少呢 zh-v1.5-bge-small已经具备了通用的检索能力,只需要在领域内稍微训一下就可以达到很好的效果了 而qwen0.5B本身是不具备检索能力的,因此微调qwen0.5B需要足够多的数据