pymorphy2
pymorphy2 copied to clipboard
Сделать предсказатель для искаженных слов (Dist)
Можно поискать какие-то "стандартные" способы коверкания слов (например, опечатки). Еще вариант - просто по расстоянию редактирования смотреть.
если по расстоянию, то лучше брать не просто расстояние Levenshtein-а, а Damerau-Levenshtein.
И как планируется определять с какими словами расстояние измерять? Как вариант: генерить из слова все варианты с расстоянием 1 (или 1-2) и просто искать их. Или пройтись по всему словарю не проблема?