kospeech icon indicating copy to clipboard operation
kospeech copied to clipboard

DeepSpeech2 모델에 대한 PR 날려드립니다.

Open kthworks opened this issue 3 years ago • 0 comments

안녕하세요, soofware님. 제가 Ksponspeech dataset을 이용해서 DeepSpeech2 모델을 훈련 시키는 과정 중에 수정했던 사항들을 반영해서 PR 날려드립니다. 수정한 내용은 총 3가지이며, 확인해주시면 감사하겠습니다.

1. kospeech 폴더를 bin 폴더 안으로 집어 넣었습니다. (kospeech폴더에 대한 경로가 이슈가 있는데 bin 폴더 안으로 집어 넣었을 때 다른 상대 경로들도 함께 해결이 되었습니다. )

2. /bin/kospeech/models/init.py의 line 32, BeamDecoderRNN import부분 삭제 (존재하지 않는 라이브러리) 모델 훈련을 시킬 때 LAS 모델쪽에 포함되어있던 BeamDecoderRNN 라이브러리가 존재하지 않아 import가 되지 않으면서 에러가 생겼고, 이 부분을 삭제했습니다.

3. train/validation 개수 조정 (kspon): /bin/kospeech/data/data_loader.py의 line 266에서 train_num = 620000, valid_num = 2545 -> train_num = 600000, valid_num = 22545로 변경 기존 ksponspeech dataset에 대한 train/validation 개수로 했더니 오류가 생겨서, 위와 같이 조정했더니 해결되었습니다.

조금이나마 도움이 되었으면 좋겠습니다. 감사합니다 :)

kthworks avatar May 17 '22 11:05 kthworks