
Results 94 comments of nl8590687

CPU就算了,别训练了,浪费时间,为什么不用GPU transformer我还在思考,只不过我现在的模型也是自己根据一些理论尝试堆积出来的结果,不是直接复现论文什么的出来的。

Yes, Because the size of the data stream is 1/8 of the input layer according to Pooling Layer(2*2) .

Maybe can, I think.

This is because of a problem with your tensorflow installation. your python is version 3.6 but your tensorflow is for python 3.5.

没在Google Cloab上运行过,请先验证运行环境是否有问题

没在Google Cloab上运行过,请先验证运行环境是否有问题



嗯嗯 这个是可以的,之前的精力主要放在声学模型上,语言模型的话,之后可以再使用各种更好的模型来改善。关于注意力机制,我也关注了一段时间了,这也在我的考虑之中。