tomita-parser
tomita-parser copied to clipboard
Tomita "берет" причастия без глаголов при указании залога
По правилу:
VVV -> Word<gram="V,pass"> interp (Perm.Action) ;
возвращает причастия (умышленное, установленное, указанным и др), а глаголы пропускает.
Если тип залога не указывать:
VVV -> Word<gram="V"> interp (Perm.Action) ;
дополнительно появляются глаголы (подтверждаться, предлагаться, взвешенного).
Как достать только глаголы в страдательном залоге?
По всей видимости, вам нужны инфинитивы и личные формы глагола с возвратным суффиксом (-ся/-сь). Вероятно, проще выделять их регулярными выражениями. Правильно определить залог можно только в контексте (см. Дом строится седьмой год vs Рота строится на плацу: слоформа одна, залоги разные).
Также рекомендую статью про залог на ruwiki, из которой можно узнать, что залогов в русском языке по меньшей мере 4 :)