SuMarsss
Results
3
issues of
SuMarsss
I have pretrained xlnet on a large chinese corpus, but how do I run the ner.py and what is label.vocab. Here is my parameters to train the Sentence Piece model...
既然想要上一个序列样本LSTM的状态传递到下一个序列样本,为什么还要使用model.reset_state()重置模型中所有层的状态,这样岂不是又变成了stateless?
你好,褚博士 为什么hidden需要grad,下一个seq只需要hidden中的值,不需要hidden的梯度啊