cai comments

Results 5 comments of

cai

关于 spearman 得分很高但检索很差的询问

> > 我有碰到过跟你一样的情况,我的原因是句向量pooling操作没有去除[PAD]位置,spearman系数特别高, 但是召回的时候100个召回率确只有0.2左右. > > 我的应该是负样本比例太低了，把正负样本设置为 1： 10，结果好了很多，但比不上 simcse。为什么要把正负比例设置这么大呢？

关于 spearman 得分很高但检索很差的询问

> > 为什么要把正负比例设置这么大呢？ > > 负样本数据量比较大，可能当时想的是把所有样本都用上吧多谢，请教2个问题： 1、本来模型得到的embedding是768维的，为啥要去降维到128维去计算相似距离？ 2、你的测试集是断句有很多语义相似的数据对，然后短句和测试集中的每一个长句计算相似度排序，然后看对应相似的长句排序位置计算MRR的吗？

about chatGPT three steps

i have the same problem，too~Could you show this simple SFT code ?

报错音频缺失

> 这个已解决可以提供一个案例demo吗？我刚用了default.zip 标注，点击播放声音没有听到任何声音呢

不能同时设定emotion_prediction='True' 和speaker_task='True'

> ![image](https://private-user-images.githubusercontent.com/54592017/289490792-8f96b0d3-c687-4051-a0b3-73281d196139.png?jwt=eyJhbGciOiJIUzI1NiIsInR5cCI6IkpXVCJ9.eyJpc3MiOiJnaXRodWIuY29tIiwiYXVkIjoicmF3LmdpdGh1YnVzZXJjb250ZW50LmNvbSIsImtleSI6ImtleTEiLCJleHAiOjE3MDM4MjExNzcsIm5iZiI6MTcwMzgyMDg3NywicGF0aCI6Ii81NDU5MjAxNy8yODk0OTA3OTItOGY5NmIwZDMtYzY4Ny00MDUxLWEwYjMtNzMyODFkMTk2MTM5LnBuZz9YLUFtei1BbGdvcml0aG09QVdTNC1ITUFDLVNIQTI1NiZYLUFtei1DcmVkZW50aWFsPUFLSUFWQ09EWUxTQTUzUFFLNFpBJTJGMjAyMzEyMjklMkZ1cy1lYXN0LTElMkZzMyUyRmF3czRfcmVxdWVzdCZYLUFtei1EYXRlPTIwMjMxMjI5VDAzMzQzN1omWC1BbXotRXhwaXJlcz0zMDAmWC1BbXotU2lnbmF0dXJlPWE1NThkZDhjOTA3YTFhMjNhYTM0ZDgwMWEwOWQxMzkxMzU4NjE4MWNlMmU5YjQxZWYxM2Y3NGY2ZDRkODJkOTImWC1BbXotU2lnbmVkSGVhZGVycz1ob3N0JmFjdG9yX2lkPTAma2V5X2lkPTAmcmVwb19pZD0wIn0.MyYk18bS2OcwgoQFV6ilyUe_7X8ZW7ng71F4ya6yyg0) 您好，从代码看好像不能同时设定emotion_prediction='True' 和speaker_task='True'，实际使用时也会报错找不到data目录。看论文中“In the first stage of joint training, we use the speaker identification task for LLM In the second stage, we fine-tune LLM using both the ERC...