SIGIR2020_peterrec
SIGIR2020_peterrec copied to clipboard
下游的年龄性别模型训练
hello, 问下,下游的年龄性别分类模型是用 PeterRec_noncau_parallel_classifier.py 跑的吗 ?
是的
是的
def random_negs(l,r,no,s):
# set_s=set(s)
negs = []
for i in range(no):
t = np.random.randint(l, r)
# while (t in set_s):
while (t== s):
t = np.random.randint(l, r)
negs.append(t)
return negs
PeterRec_noncau_parallel_classifier.py 代码中使用这段代码采样负样本进行分类测试,会采样相同类别的负样本,对于分类指标会偏高?
你好,从统计角度讲,对结果没有影响。当然您也可以去除重复的都可以。
在 2021-01-04 10:41:06,"Kaibing Chen" [email protected] 写道:
是的
def random_negs(l,r,no,s):
# set_s=set(s)
negs = []
for i in range(no):
t = np.random.randint(l, r)
# while (t in set_s):
while (t== s):
t = np.random.randint(l, r)
negs.append(t)
return negs
PeterRec_noncau_parallel_classifier.py 代码中使用这段代码采样负样本进行分类测试,会采样相同类别的负样本,对于分类指标会偏高?
— You are receiving this because you commented. Reply to this email directly, view it on GitHub, or unsubscribe.
你好,从统计角度讲,对结果没有影响。当然您也可以去除重复的都可以。
对于年龄性别这些下游任务,类别都较少,随机采负样本测试,统计上指标都会偏高的,整体上相当于测试的类别变少了
实际跑的时候,不去重跑出来与你论文的指标差不多,稍微低点;去重后指标要低个10个点左右
你好,只需要所有baseline的evaluation保持一致就可以哈
在 2021-01-04 10:50:40,"Kaibing Chen" [email protected] 写道:
你好,从统计角度讲,对结果没有影响。当然您也可以去除重复的都可以。
对于年龄性别这些下游任务,类别都较少,随机采负样本测试,统计上指标都会偏高的,整体上相当于测试的类别变少了
实际跑的时候,不去重跑出来与你论文的指标差不多,稍微低点;去重后指标要低个10个点左右
— You are receiving this because you commented. Reply to this email directly, view it on GitHub, or unsubscribe.
你好,只需要所有baseline的evaluation保持一致就可以哈 在 2021-01-04 10:50:40,"Kaibing Chen" [email protected] 写道: 你好,从统计角度讲,对结果没有影响。当然您也可以去除重复的都可以。 对于年龄性别这些下游任务,类别都较少,随机采负样本测试,统计上指标都会偏高的,整体上相当于测试的类别变少了 实际跑的时候,不去重跑出来与你论文的指标差不多,稍微低点;去重后指标要低个10个点左右 — You are receiving this because you commented. Reply to this email directly, view it on GitHub, or unsubscribe.
OK