cai
cai
> > 我有碰到过跟你一样的情况,我的原因是句向量pooling操作没有去除[PAD]位置,spearman系数特别高, 但是召回的时候100个召回率确只有0.2左右. > > 我的应该是负样本比例太低了,把正负样本设置为 1: 10,结果好了很多,但比不上 simcse。 为什么要把正负比例设置这么大呢?
> > 为什么要把正负比例设置这么大呢? > > 负样本数据量比较大,可能当时想的是把所有样本都用上吧 多谢,请教2个问题: 1、本来模型得到的embedding是768维的,为啥要去降维到128维去计算相似距离? 2、你的测试集是断句有很多语义相似的数据对,然后短句和测试集中的每一个长句计算相似度排序,然后看对应相似的长句排序位置计算MRR的吗?
i have the same problem,too~Could you show this simple SFT code ?
> 这个已解决 可以提供一个案例demo吗?我刚用了default.zip 标注,点击播放声音没有听到任何声音呢
> data:image/s3,"s3://crabby-images/04806/0480632067c5445efa14ccb03d99088560852b36" alt="image" 您好,从代码看好像不能同时设定emotion_prediction='True' 和speaker_task='True',实际使用时也会报错找不到data目录。 看论文中“In the first stage of joint training, we use the speaker identification task for LLM In the second stage, we fine-tune LLM using both the ERC...