Tacotron2-Wavenet-Korean-TTS icon indicating copy to clipboard operation
Tacotron2-Wavenet-Korean-TTS copied to clipboard

tacotron2 train test wav 파일 png파일 문구와 실제 test wav음성이 다른 것 문의드립니다.

Open yangwook opened this issue 5 years ago • 5 comments

tacotron2 train test wav 파일 png파일 문구와 실제 test wav음성이 다른 것 문의드립니다. test wave 음성이 train png 파일 문구가 나오는데 이건 원래 그런 건가요? 아니면 세팅해주어야 하는 건가요? pip freeze 환경 공유 가능할까요?

yangwook avatar Jul 21 '19 03:07 yangwook

git downlaod 받아 그 상태에서 python train_tacotron2.py 실행하였습니다. train시 텍스트와 wave 파일이 다르게 학습되는 걸로 보이는데 이런 경우 원인을 알기 어렵네요? 참고할 만한 사항 있을까요?

yangwook avatar Jul 22 '19 02:07 yangwook

음성합성 학습이 제대로 동작 되는지요?

yangwook avatar Aug 09 '19 03:08 yangwook

train용 input data를 만들 때, audio와 text의 sync가 잘 맞지 않은 것 같습니다. data를 다시 살펴보셔야 할 것 같습니다.

hccho2 avatar Sep 17 '19 05:09 hccho2

image

학습시 test의 결과(png, wav)와 train의 결과(png, wav) 파일이 각각 만들어 지고, 다른 텍스트로 각기 만들어지는데... 혹시 Train, test결과의 png와 wav 파일과 png 파일을 서로 섞어서 확인한건 아닌지요...?

great-energizer avatar Aug 03 '20 07:08 great-energizer

train은 teacher forcing 방식으로 음성을 생성합니다. test에는 teacher forcing 방식이 사용될 수 없기 때문에 각각 생성하고 있습니다.

hccho2 avatar Aug 24 '20 23:08 hccho2