ml-tutorial
ml-tutorial copied to clipboard
ctc logits梯度如何推导
我在km上搜到这篇文章,非常感谢,写的太好了。就是在ctc logits梯度那里,我没看明白是怎么推导的。一般sofmax的导数当i=j时,是,是如何推导得到最后一个公式呢?谢谢!
我在 CONNECTIONIST TEMPORAL CLASSIFICATION 的第七章和http://wantee.github.io/2015/02/08/rnnlib-connectionist-temporal-classification-and-transcription-layer/#mjx-eqn-eqlabelling_fwd_bwd中结合推导出了一个过程如下: