pymorphy2 icon indicating copy to clipboard operation
pymorphy2 copied to clipboard

Затруднение со словом.

Open leaf-on-a-wind opened this issue 2 years ago • 1 comments

Понимаю, что выглядит... ээээ... специфично, и тем не менее:

len(morph.parse('писей')) 2 morph.parse('писей')[0].normal_form 'писеять' morph.parse('писей')[1].normal_form 'пись'

Хотя должно быть что-то вроде: Именительный падеж: пися Родительный падеж: писи Дательный падеж: писе Винительный падеж: писю Творительный падеж: писей Предложный падеж: о писе

Версия библиотеки и словаря: pymorphy2 0.9.1 pymorphy2-dicts-ru 2.4.417127.4579844

Так же не совсем верно (на мой взгляд) выставлен приоритет у слова "курлык":

morph.parse('курлыком')[0].normal_form 'курлыко' morph.parse('курлыком')[1].normal_form 'курлыкома' morph.parse('курлыком')[2].normal_form 'курлыком' morph.parse('курлыком')[3].normal_form 'курлыком' morph.parse('курлыком')[4].normal_form 'курлык'

Хотя, по идее, - дожно быть в 0-м индексе(но, это не точно).

leaf-on-a-wind avatar Sep 01 '23 08:09 leaf-on-a-wind

Если слово вне контекста может быть и существительным, и глаголом (или слово не известно, и парсер определяет, что это может быть как существительное, так и глагол), то вообще нет никаких причин, почему именно существительное или именно глагол должен иметь более высокий приоритет.

В целом, лучше вообще не ориентироваться на нулевой разбор. Нужно ориентироваться на лучший подходящий разбор. Например, если точно известно, что на входе существительное, то отбирать результаты разбора, где POS == "noun", и после этого брать нулевой разбор.

insolor avatar Sep 01 '23 08:09 insolor