pymorphy2 icon indicating copy to clipboard operation
pymorphy2 copied to clipboard

Сделать предсказатель для искаженных слов (Dist)

Open kmike opened this issue 11 years ago • 1 comments

Можно поискать какие-то "стандартные" способы коверкания слов (например, опечатки). Еще вариант - просто по расстоянию редактирования смотреть.

kmike avatar Apr 19 '14 22:04 kmike

если по расстоянию, то лучше брать не просто расстояние Levenshtein-а, а Damerau-Levenshtein.

И как планируется определять с какими словами расстояние измерять? Как вариант: генерить из слова все варианты с расстоянием 1 (или 1-2) и просто искать их. Или пройтись по всему словарю не проблема?

imposeren avatar Apr 06 '16 13:04 imposeren