OneRel_chinese
OneRel_chinese copied to clipboard
训练时的mask
您好,想问一下为什么在训练的时候mask矩阵中非padding的位置要用2标注而不是1呢?
您好,想问一下为什么在训练的时候mask矩阵中非padding的位置要用2标注而不是1呢?
貌似是个bug,修改了下。
还是有这个问题
还是有这个问题
具体是哪个地方有问题。