Jiho Jeong
Jiho Jeong
> Please help me with this issue. I build targets like the installation instructions. I modified the env via $CUDA_HOME before build and used > > cmake -DCUDA_TOOLKIT_ROOT_DIR=$CUDA_HOME .. make...
제 코드에 대해서 관심 가져주셔서 감사합니다. 일단 54개로 설정한 것은 실수인 것 같습니다. 제가 과거에 space를 없애고 cer결과를 뽑는 실험을 했는데 그때 수정했어야 하는데 꼼꼼히 확인하지 못했습니다. 아마도 54개로 학습을...
Q1. def recognize(self, inputs, inputs_length): batch_size = inputs.size(0) enc_states, _ = self.encoder(inputs, inputs_length) zero_token = torch.LongTensor([[0]]) if inputs.is_cuda: zero_token = zero_token.cuda() def decode(enc_state, lengths): token_list = [] dec_state, hidden =...
제가 질문 이해를 잘못한것 같습니다. pred != 0 ---> 이 의미는 blank가 아닌 character를 예측한 것으로 transducer 구조(첨부한 그림 참조)에서 수직으로 이동한 것에 해당합니다. 이 경우에는 (encoder time step) t가...
@YooSungHyun 혹시 u < beam size는 왜 사용하셨는지 알려주실수 있으신가요? 한 프레임에서 여러 label이 나올 가능성을 염두하시고 작성하신걸로 이해하였는데 맞나요?
@YooSungHyun t=1일때, encode time sequence 1에 대해 blank가 아닐때까지 예측을 진행하며, 모든 디코딩 가능한 경우의 수를 뽑습니다. 안, 얀, 야, 아, 안.... (블랭크가 영영 나오지 않는다면, 무한 루프에 빠질 수...
@YooSungHyun 아 이 그림은 infernece 그림이 아니라 best path의 probability를 찾는겁니다. CTC 그래프를 생각하시면 편할것 같습니다.
@YooSungHyun python file을 하나 추가해서 example 처럼 만들어놓는것이 좋을것 같습니다!
늦게 답장드려서 죄송합니다. 저는 리눅스 서버 환경에서 테스트해봐서 윈도우 환경에는 도움을 못드릴것 같습니다. 추가적으로 첨부드린 곳의 issue를 한번 검토해주시면 비슷한 사례가 있을 수도 있습니다. 감사합니다. https://github.com/HawkAaron/warp-transducer/tree/master/pytorch_binding