cai

Results 5 comments of cai

> > 我有碰到过跟你一样的情况,我的原因是句向量pooling操作没有去除[PAD]位置,spearman系数特别高, 但是召回的时候100个召回率确只有0.2左右. > > 我的应该是负样本比例太低了,把正负样本设置为 1: 10,结果好了很多,但比不上 simcse。 为什么要把正负比例设置这么大呢?

> > 为什么要把正负比例设置这么大呢? > > 负样本数据量比较大,可能当时想的是把所有样本都用上吧 多谢,请教2个问题: 1、本来模型得到的embedding是768维的,为啥要去降维到128维去计算相似距离? 2、你的测试集是断句有很多语义相似的数据对,然后短句和测试集中的每一个长句计算相似度排序,然后看对应相似的长句排序位置计算MRR的吗?

i have the same problem,too~Could you show this simple SFT code ?

> 这个已解决 可以提供一个案例demo吗?我刚用了default.zip 标注,点击播放声音没有听到任何声音呢

> ![image](https://private-user-images.githubusercontent.com/54592017/289490792-8f96b0d3-c687-4051-a0b3-73281d196139.png?jwt=eyJhbGciOiJIUzI1NiIsInR5cCI6IkpXVCJ9.eyJpc3MiOiJnaXRodWIuY29tIiwiYXVkIjoicmF3LmdpdGh1YnVzZXJjb250ZW50LmNvbSIsImtleSI6ImtleTEiLCJleHAiOjE3MDM4MjExNzcsIm5iZiI6MTcwMzgyMDg3NywicGF0aCI6Ii81NDU5MjAxNy8yODk0OTA3OTItOGY5NmIwZDMtYzY4Ny00MDUxLWEwYjMtNzMyODFkMTk2MTM5LnBuZz9YLUFtei1BbGdvcml0aG09QVdTNC1ITUFDLVNIQTI1NiZYLUFtei1DcmVkZW50aWFsPUFLSUFWQ09EWUxTQTUzUFFLNFpBJTJGMjAyMzEyMjklMkZ1cy1lYXN0LTElMkZzMyUyRmF3czRfcmVxdWVzdCZYLUFtei1EYXRlPTIwMjMxMjI5VDAzMzQzN1omWC1BbXotRXhwaXJlcz0zMDAmWC1BbXotU2lnbmF0dXJlPWE1NThkZDhjOTA3YTFhMjNhYTM0ZDgwMWEwOWQxMzkxMzU4NjE4MWNlMmU5YjQxZWYxM2Y3NGY2ZDRkODJkOTImWC1BbXotU2lnbmVkSGVhZGVycz1ob3N0JmFjdG9yX2lkPTAma2V5X2lkPTAmcmVwb19pZD0wIn0.MyYk18bS2OcwgoQFV6ilyUe_7X8ZW7ng71F4ya6yyg0) 您好,从代码看好像不能同时设定emotion_prediction='True' 和speaker_task='True',实际使用时也会报错找不到data目录。 看论文中“In the first stage of joint training, we use the speaker identification task for LLM In the second stage, we fine-tune LLM using both the ERC...