speechbook icon indicating copy to clipboard operation
speechbook copied to clipboard

Connectionist Temporal Classification - ratsgo's speechbook

Open utterances-bot opened this issue 4 years ago • 4 comments
trafficstars

Connectionist Temporal Classification - ratsgo's speechbook

articles about speech recognition

https://ratsgo.github.io/speechbook/docs/neuralam/ctc

utterances-bot avatar Dec 22 '20 05:12 utterances-bot

이해가 안되는 부분이 있어서 질문 남깁니다. Forward Probability와 Backward Probability를 정의할 때 alpha_t(s), beta_t(s) 이런식으로 정의하는데, s가 l에 대해서 쓰여져 있습니다. 수식5와 9에서 l의 밑첨자 부분입니다. 그런데 알파와 베타의 recurrence(수식 7과 11)에서는 l_s이 아니라 l'_s를 y의 밑첨자로 사용하고 있는데, 두개가 같지 않은 이유가 뭘까요? s가 l의 인덱스면서 l'의 인덱스일 순 없을거 같습니다.

seastar105 avatar Dec 22 '20 05:12 seastar105

정말 엄청납니다! 감사합니다

seunghyeon528 avatar Jan 24 '21 13:01 seunghyeon528

연산을 위해 dim을 줄여야하는 상황이 계속된다면 CTC의 의존도는 높아질수 밖에 없네요. model이 seq별 dim을 그대로 가져간다면 좀더 정확한 결과가 나올 것 같네요.

seohyunjun avatar Feb 20 '23 02:02 seohyunjun

그림 4에서 t4->t5로 갈 때 l에서 l로 가는 화살표 하나 잘못 그어져 있네요

bullgokman avatar Nov 23 '23 03:11 bullgokman