SIGIR2020_peterrec 下游的年龄性别模型训练

下游的年龄性别模型训练

Open kebinC opened this issue 3 years ago • 6 comments

hello，问下，下游的年龄性别分类模型是用 PeterRec_noncau_parallel_classifier.py 跑的吗？

Dec 23 '20 13:12 kebinC

是的

Jan 04 '21 02:01 yuan2961634811

是的

def random_negs(l,r,no,s):
    # set_s=set(s)
    negs = []
    for i in range(no):
        t = np.random.randint(l, r)
        # while (t in set_s):
        while (t== s):
            t = np.random.randint(l, r)
        negs.append(t)
    return negs

PeterRec_noncau_parallel_classifier.py 代码中使用这段代码采样负样本进行分类测试，会采样相同类别的负样本，对于分类指标会偏高？

Jan 04 '21 02:01 kebinC

你好，从统计角度讲，对结果没有影响。当然您也可以去除重复的都可以。

在 2021-01-04 10:41:06，"Kaibing Chen" [email protected] 写道：

是的

def random_negs(l,r,no,s):

# set_s=set(s)

negs = []

for i in range(no):

    t = np.random.randint(l, r)

    # while (t in set_s):

    while (t== s):

        t = np.random.randint(l, r)

    negs.append(t)

return negs

PeterRec_noncau_parallel_classifier.py 代码中使用这段代码采样负样本进行分类测试，会采样相同类别的负样本，对于分类指标会偏高？

— You are receiving this because you commented. Reply to this email directly, view it on GitHub, or unsubscribe.

Jan 04 '21 02:01 yuan2961634811

你好，从统计角度讲，对结果没有影响。当然您也可以去除重复的都可以。

对于年龄性别这些下游任务，类别都较少，随机采负样本测试，统计上指标都会偏高的，整体上相当于测试的类别变少了

实际跑的时候，不去重跑出来与你论文的指标差不多，稍微低点；去重后指标要低个10个点左右

Jan 04 '21 02:01 kebinC

你好，只需要所有baseline的evaluation保持一致就可以哈

在 2021-01-04 10:50:40，"Kaibing Chen" [email protected] 写道：

你好，从统计角度讲，对结果没有影响。当然您也可以去除重复的都可以。

对于年龄性别这些下游任务，类别都较少，随机采负样本测试，统计上指标都会偏高的，整体上相当于测试的类别变少了

实际跑的时候，不去重跑出来与你论文的指标差不多，稍微低点；去重后指标要低个10个点左右

— You are receiving this because you commented. Reply to this email directly, view it on GitHub, or unsubscribe.

Jan 04 '21 02:01 yuan2961634811

你好，只需要所有baseline的evaluation保持一致就可以哈在 2021-01-04 10:50:40，"Kaibing Chen" [email protected] 写道：你好，从统计角度讲，对结果没有影响。当然您也可以去除重复的都可以。对于年龄性别这些下游任务，类别都较少，随机采负样本测试，统计上指标都会偏高的，整体上相当于测试的类别变少了实际跑的时候，不去重跑出来与你论文的指标差不多，稍微低点；去重后指标要低个10个点左右 — You are receiving this because you commented. Reply to this email directly, view it on GitHub, or unsubscribe.

Jan 04 '21 02:01 kebinC

SIGIR2020_peterrec SIGIR2020_peterrec copied to clipboard

下游的年龄性别模型训练

SIGIR2020_peterrec
SIGIR2020_peterrec copied to clipboard