bert_seq2seq
bert_seq2seq copied to clipboard
您好 请问在simbert模型里面 seq2seq的loss比similarity的loss大的多是正常的吗?
两者能正常下降,大概率应该就是没问题
两者能正常下降,大概率应该就是没问题
您好 我把您关于similarity loss获得labels函数的最后一段的argmax给注释掉了 因为我看苏神的bert4keras这一块好像直接就把labels矩阵传过去了 请问您为什么要在那一块加argmax呀
这块感觉问题不大,去掉也行。