hunspell-dict-ko
hunspell-dict-ko copied to clipboard
Korean spellchecking dictionary for Hunspell
데비안 빌드 중에서 https://buildd.debian.org/status/fetch.php?pkg=hunspell-dict-ko&arch=all&ver=0.7.92-1&stamp=1575459898&raw=0 ``` make -j4 "INSTALL=install --strip-program=true" make[1]: Entering directory '/' python3 make-aff-dic.py ko.aff ko.dic dict-ko-builtins.yaml dict-ko-data.yaml python3 make-aff-dic.py ko.aff ko.dic dict-ko-builtins.yaml dict-ko-data.yaml Progress: 중복 제거... Status: 중복...
결국 마찬가지이기는 하지만, 파이썬 코드의 데이터를 단어 데이터로 바꿈으로써 장점이 있다. - 파이썬 코드를 단어 열거로 바꾸어 관리 부담을 코드에서 데이터로 옮긴다. - 국어 문법의 9품사 중의 하나이므로 형태소분석 기능에서...
접미사 ~별
(http://code.google.com/p/spellcheck-ko/issues/detail?id=14) --- 문제점이 발생하는 상황을 설명해 주십시오. 1. 접미사 ~별
* 뵙다 * 보조용언 가지다/갖다 (-어 가지고/갖고)
어미 활용 정보를 현재 suffixdata.py 파일에 일일이 기록하고 있는데, 길이도 길어지고 관리가 쉽지 않다. 단어 데이터로 분리해서 사용할 수 있도록 개편. - 한국어기초사전에 어미도 포함되어 있으므로, 이쪽 데이터를 사용한다. -...
"받은듯하다"는 되고 "받으신듯하다"은 안 되는 상황. - 네이버 맞춤법 검사에서는 틀린 단어로 취급. - 다음 맞춤법 검사, 부산대에서는 맞는 단어로 취급. ~~안 그래도 용량이 커지고 성능이 떨어지는 주범인 보조용언 확장에...
한국어기초사전 정보를 보면 형용사 뒤에 오는 보조 용언과 동사 뒤에 오는 보조 용언이 구분되어 있다. ("일부" 형용사/동사 뒤에 오는 경우도) 이 정보를 활용해 보조 용언 붙은 형태를 줄여서 효율 높이는...
맞춤법 검사에 적합한 인코딩은 두벌식 키보드 스트로크이다. 두벌식 키보드를 사용해서 발생하는 오타 뿐만 아니라 자음이 종성에 붙는지 초성에 붙는지 헷갈리는 오타 패턴이 많이 발견된다. 연음법칙 때문이기도 하다. 문제는 이러한 인코딩은...
(http://code.google.com/p/spellcheck-ko/issues/detail?id=5) --- 명사의 종류에 따라 제약이 있는 조사를 구분. 1. 사람/동물에만 붙는 경우 2. 셀 수 있는 대상에만 붙는 경우 3. 몇몇 대명사 (나가(x), 내가(o), 너가(x), 네가(o)) --- 대명사 이거/그거/저거...