aisen
aisen
我对源码做了如下优化: 使用更高效的数据读取方式: 通过datasets库的流式API来逐步读取数据,避免一次加载整个数据集到内存中。 动态数据加载: 只有在__getitem__方法被调用时才加载和处理数据。 利用DataLoader的num_workers: 通过多线程来加速数据加载。 我在项目中测试完成提交一下代码,ok不
 修改了一下上述文件
好的 ,后面项目测试完成再来提交代码
我在30万Paper的QD对的数据集上微调bge-reranker-v2-gemma,梯度下降很慢,我现在设置的num_train_epochs=1,我需要多训练几轮嘛,训练进度60% loss从1.5下降到0.98,感觉一批次训练完,loss应该还是会比较高0.7左右,我训练再训练一轮嘛?
 这里是一个query和docs的任务 我是需要修改prompt 然后只传docs 只获取docs的embedding嘛
不需要再调整prompt也就是query_instruction_for_retrieval的参数内容嘛?