Keyword-BERT icon indicating copy to clipboard operation
Keyword-BERT copied to clipboard

正负样本的比例

Open kscp123 opened this issue 4 years ago • 4 comments

请问正负样本的比例有什么建议吗,谢谢

kscp123 avatar Nov 09 '20 01:11 kscp123

我们试过 1:1 1:3 1:5 1:10 之类

DataTerminatorX avatar Dec 08 '20 12:12 DataTerminatorX

我们试过 1:1 1:3 1:5 1:10 之类

1:5,1:10这么夸张么,这样不会导致大多都预测负例吗

kscp123 avatar Dec 10 '20 07:12 kscp123

其实最后是个排序问题,从一堆Q中找最match的Q,所以单个pair对儿的准确率并不是最重要的

DataTerminatorX avatar Dec 14 '20 09:12 DataTerminatorX

其实最后是个排序问题,从一堆Q中找最match的Q,所以单个pair对儿的准确率并不是最重要的

代码里使用的二分类任务进行的训练,实验这样预测的置信度一般都很高且接近,比如0.996、0.999等这样,这样是不好通过排序从一堆Q中找到最match的吧,请问作者有这个问题吗

EvelynZhaoShiMei avatar Jun 08 '21 06:06 EvelynZhaoShiMei