Introduction - ratsgo's speechbook

Open utterances-bot opened this issue 4 years ago • 3 comments

articles about speech recognition

May 03 '20 07:05 utterances-bot

사소한 오타:

음향 특징(Acoustic Feture)이 바로 MFCCs(Mel-Frequency Cepstral Coefficients)입니다 Feture --> Feature

Jun 23 '20 00:06 hccho2

문의:

하지만 같은 음소나 단어라 하더라도 사람마다 발음하는 양상이 다릅니다. 화자가 남성이냐 여성이냐에 따라서도 음성 신호는 달라질 수 있습니다. 다시 말해 음성 신호의 다양한 변이형을 모두 커버하는 모델을 만들기가 쉽지 않다는 것입니다.

에서, P(X|Y) 또한 화자에 따라 다른 값이 도출되는건 동일한 것 아닌가합니다. P(Y|X)를 하기 어려운 한계는 X의 범위가 Y에 비해 현저히 크며, P(X|Y)의 경우에는 Y를 한정지을 수 있기 때문은 아닌지 싶네요

Jun 29 '20 00:06 DusanBaek

동감합니다. X의 분포를 모르기 때문에 P(Y|X)를 계산할 수 없으므로 계산할 수 있는 형태로 바꾼다 보는 게 맞는 것 같습니다.

Apr 08 '23 09:04 jooeun9199

speechbook speechbook copied to clipboard