speechbook
speechbook copied to clipboard
Connectionist Temporal Classification - ratsgo's speechbook
trafficstars
Connectionist Temporal Classification - ratsgo's speechbook
articles about speech recognition
이해가 안되는 부분이 있어서 질문 남깁니다. Forward Probability와 Backward Probability를 정의할 때 alpha_t(s), beta_t(s) 이런식으로 정의하는데, s가 l에 대해서 쓰여져 있습니다. 수식5와 9에서 l의 밑첨자 부분입니다. 그런데 알파와 베타의 recurrence(수식 7과 11)에서는 l_s이 아니라 l'_s를 y의 밑첨자로 사용하고 있는데, 두개가 같지 않은 이유가 뭘까요? s가 l의 인덱스면서 l'의 인덱스일 순 없을거 같습니다.
정말 엄청납니다! 감사합니다
연산을 위해 dim을 줄여야하는 상황이 계속된다면 CTC의 의존도는 높아질수 밖에 없네요. model이 seq별 dim을 그대로 가져간다면 좀더 정확한 결과가 나올 것 같네요.
그림 4에서 t4->t5로 갈 때 l에서 l로 가는 화살표 하나 잘못 그어져 있네요