pymorphy2
pymorphy2 copied to clipboard
Определять аббревиатуры
Сейчас анализатор не понимает что КПСС, КПРФ или ООО это аббревиатуры. Было бы очень полезно отделять их.
+1 к тому, чтоб анализатор для таких аббривеатур добавить, это и правда важно. Он должен смотреть на слово, и если оно записано заглавными буквами и, возможно, не очень длинное, то добавлять варианты разбора как аббривеатуры (неизменяемое существительное, с вариантами по всем 3 родам).
Многие аббривеатуры, кстати, в словаре есть; если говорить конкретно про КПСС, КПРФ и ООО, то pymorphy2 их сейчас понимает и разбирает правильно (ну с некоторыми особенностями, см. также https://github.com/OpenCorpora/opencorpora/issues/94).