ml-tutorial
ml-tutorial copied to clipboard
machine learning algorithms and implementations
看了你的文章,感觉非常棒。但是看到前向向量部分,我有点疑惑,  在这个公式的定义中,为什么t可以小于s?
我在km上搜到这篇文章,非常感谢,写的太好了。就是在ctc logits梯度那里,我没看明白是怎么推导的。一般sofmax的导数当i=j时,是,是如何推导得到最后一个公式呢?谢谢! 我在 CONNECTIONIST TEMPORAL CLASSIFICATION 的第七章和[http://wantee.github.io/2015/02/08/rnnlib-connectionist-temporal-classification-and-transcription-layer/#mjx-eqn-eqlabelling_fwd_bwd](url)中结合推导出了一个过程如下:  