SIGIR2020_peterrec icon indicating copy to clipboard operation
SIGIR2020_peterrec copied to clipboard

Pretrain performance?

Open vcpudding opened this issue 3 years ago • 8 comments

在ColdRec2数据集上pretrain,收敛的时候正常的HR@5应该是多少? 'mrr_5:', 0.030770833333333344, 'hit_5:', 0.05375, 'ndcg_5:', 0.03643626106347057 这个数值范围是不是预训练不成功?

vcpudding avatar Apr 26 '21 01:04 vcpudding

我没记错的话mrr_5应该是0.047左右,按照论文提供的超参数应该是可以得到这个值的,建议看下是否converge

fajieyuan avatar Apr 26 '21 02:04 fajieyuan

100+个batch之后训练集和验证集的loss下降都很不明显,判断converge主要是看mrr_5这几个数值的变化情况吗?

vcpudding avatar Apr 26 '21 02:04 vcpudding

我记得代码会隔一段时间打印accuracy,采用accuracy判断更可靠些。请核对一下相关超参数跟论文中是否有出入,100个batch肯定不行,可以算一下总样本有多少,100个batch可能还不到总样本的十分之一,至少需要pre-train 10个小时以上

fajieyuan avatar Apr 26 '21 02:04 fajieyuan

感谢原教授~我的实验复现成功了~ 然后,这可能是另一个问题:为什么demo数据里的pretrain和finetune数据都是一一对应的?如果在pretrain时加入更多在target domain没有交集用户的数据,对系统整体性能会有什么影响?

vcpudding avatar Apr 27 '21 03:04 vcpudding

demo写法主要是未来让刚学习这个算法的同学好理解,可以的,pre-train可以包含更多的用户,finetune可以仅仅其中一部分用户,建议写个词典对应准确就可以,不要错位,我代码是最简单的写法,主要是为了好读

fajieyuan avatar Apr 27 '21 03:04 fajieyuan

感谢原教授~我的实验复现成功了~ 然后,这可能是另一个问题:为什么demo数据里的pretrain和finetune数据都是一一对应的?如果在pretrain时加入更多在target domain没有交集用户的数据,对系统整体性能会有什么影响?

demo写法主要是未来让刚学习这个算法的同学好理解,可以的,pre-train可以包含更多的用户,finetune可以仅仅其中一部分用户,建议写个词典对应准确就可以,不要错位,我代码是最简单的写法,主要是为了好读

fajieyuan avatar Apr 27 '21 03:04 fajieyuan

hello, 这里提到的词典对应、不要错位是啥意思?我理解finetune的user ids应该是pre-train用到的user ids的子集即可?

jh-lau avatar May 11 '22 07:05 jh-lau

就是这个意思。我为了使用简单就没有加userID,别对错号

从 Windows 版邮件https://go.microsoft.com/fwlink/?LinkId=550986发送

发件人: @.> 发送时间: 2022年5月11日 15:45 收件人: @.> 抄送: Fajie YUAN @.>; @.> 主题: Re: [fajieyuan/SIGIR2020_peterrec] Pretrain performance? (#5)

hello, 这里提到的词典对应、不要错位是啥意思?我理解finetune的user ids应该是pre-train用到的user ids的子集即可?

― Reply to this email directly, view it on GitHubhttps://github.com/fajieyuan/SIGIR2020_peterrec/issues/5#issuecomment-1123302723, or unsubscribehttps://github.com/notifications/unsubscribe-auth/ADTZGLJWMCQLEBESLJ25I43VJNQR3ANCNFSM43R5FAMA. You are receiving this because you commented.Message ID: @.***>

fajieyuan avatar May 11 '22 07:05 fajieyuan