KoGPT2 icon indicating copy to clipboard operation
KoGPT2 copied to clipboard

단어의 음절과 음절 사이에 공백 추가 문제

Open gimalgosa0514 opened this issue 2 years ago • 0 comments

안녕하십니까 NLP 공부중인 학부생입니다. transformers 의 AutoTokenizer를 통해 토크나이져를 생성하고, 음절 단위로 임베딩 하였을 때 일부 토큰과 토큰 사이에 공백이 추가된 현상이 있습니다.. 화면 캡처 2024-04-15 222034

gimalgosa0514 avatar Apr 15 '24 13:04 gimalgosa0514