Tacotron2-Wavenet-Korean-TTS
Tacotron2-Wavenet-Korean-TTS copied to clipboard
tacotron2 train test wav 파일 png파일 문구와 실제 test wav음성이 다른 것 문의드립니다.
tacotron2 train test wav 파일 png파일 문구와 실제 test wav음성이 다른 것 문의드립니다. test wave 음성이 train png 파일 문구가 나오는데 이건 원래 그런 건가요? 아니면 세팅해주어야 하는 건가요? pip freeze 환경 공유 가능할까요?
git downlaod 받아 그 상태에서 python train_tacotron2.py 실행하였습니다. train시 텍스트와 wave 파일이 다르게 학습되는 걸로 보이는데 이런 경우 원인을 알기 어렵네요? 참고할 만한 사항 있을까요?
음성합성 학습이 제대로 동작 되는지요?
train용 input data를 만들 때, audio와 text의 sync가 잘 맞지 않은 것 같습니다. data를 다시 살펴보셔야 할 것 같습니다.
학습시 test의 결과(png, wav)와 train의 결과(png, wav) 파일이 각각 만들어 지고, 다른 텍스트로 각기 만들어지는데... 혹시 Train, test결과의 png와 wav 파일과 png 파일을 서로 섞어서 확인한건 아닌지요...?
train은 teacher forcing 방식으로 음성을 생성합니다. test에는 teacher forcing 방식이 사용될 수 없기 때문에 각각 생성하고 있습니다.