aisen

Results 8 comments of aisen

我对源码做了如下优化: 使用更高效的数据读取方式: 通过datasets库的流式API来逐步读取数据,避免一次加载整个数据集到内存中。 动态数据加载: 只有在__getitem__方法被调用时才加载和处理数据。 利用DataLoader的num_workers: 通过多线程来加速数据加载。 我在项目中测试完成提交一下代码,ok不

![image](https://github.com/FlagOpen/FlagEmbedding/assets/55675532/2679050b-476d-4e90-9d73-0a4a2098f36d) 修改了一下上述文件

我在30万Paper的QD对的数据集上微调bge-reranker-v2-gemma,梯度下降很慢,我现在设置的num_train_epochs=1,我需要多训练几轮嘛,训练进度60% loss从1.5下降到0.98,感觉一批次训练完,loss应该还是会比较高0.7左右,我训练再训练一轮嘛?

![模型使用](https://github.com/user-attachments/assets/b9bc89a2-2eed-4a22-90c5-9e568ed70a97) 这里是一个query和docs的任务 我是需要修改prompt 然后只传docs 只获取docs的embedding嘛