SuMarsss

Results 3 issues of SuMarsss

I have pretrained xlnet on a large chinese corpus, but how do I run the ner.py and what is label.vocab. Here is my parameters to train the Sentence Piece model...

既然想要上一个序列样本LSTM的状态传递到下一个序列样本,为什么还要使用model.reset_state()重置模型中所有层的状态,这样岂不是又变成了stateless?

你好,褚博士 为什么hidden需要grad,下一个seq只需要hidden中的值,不需要hidden的梯度啊