LSTNet
LSTNet copied to clipboard
你好,请教一些关于训练的问题
论文里列出了transformer的cider分数131左右,最近我也在用这套代码训练3enc+3dec的纯transformer模型,cider分数只能达到127左右,我看到你代码中python和pytorch版本都非常的低,请问最终表现和版本相关性大吗?谢谢。
您好,python 和pytorch的版本会有一定影响,但是应该不会相差这么多。 另外,我是用1080进行训练的,不知道是否显卡的版本。