Guwen-UNILM
Guwen-UNILM copied to clipboard
本仓库是基于bert4keras实现的古文-现代文翻译模型。具体使用了基于掩码自注意力机制的UNILM(Li al., 2019)预训练模型作为翻译系统的backbone。我们首先使用了普通的中文(现代文)BERT、Roberta权重作为UNILM的初始...
Results
2
Guwen-UNILM issues
Sort by
recently updated
recently updated
newest added
请问您是用gpu跑的吗?cuda版本是多少?
完整的报错如下: 他显示我的数组越界?我使用的数据和模型和参数和仓库中是一样的 而且我只有使用guwenbert的时候会碰到这样子的问题,其他时间并不会 WARNING:tensorflow:From D:\anoconda\envs\python3.7\lib\site-packages\tensorflow_core\python\ops\math_grad.py:1424: where (from tensorflow.python.ops.array_ops) is deprecated and will be removed in a future version. Instructions for updating: Use tf.where in 2.0, which has the same broadcast...
bug