Ariel-lu

Results 5 issues of Ariel-lu

Hi, I 'd like to know why you set weight _ loss to 2?

我将模型用到长度为400的文本数据上,训练速度变得很慢,跑一个epoch用的时间大概是原来的五六倍,想请教一下这是因为模型太复杂了吗,怎样可以减小开销,还是随着句子长度增加训练时间本来就会成倍增长?以及我用4090 24gb的卡跑,NYT的batch_size仍然只能跑到6,不然显存不够,请问是我的设置有问题吗?

您好,想问一下为什么在训练的时候mask矩阵中非padding的位置要用2标注而不是1呢?

您好,我想复现一下代码但是提示No module named 'keras.engine',请问是要把pytorch和tensorflow放在同一个环境中吗?