tomita-parser
tomita-parser copied to clipboard
Своебразно работает сегментатор
Простой текст с адресом
г. Москва ул. Порываева, дом 22, корп.1, кв. 23
Сегментатор разбивает на 4 предложения
г . EOS Москва ул . EOS Порываева , дом 22 , корп.1 , кв . EOS 31 EOS
Правильно ли я понимаю, что нет возможности создавать грамматические правила, которые бы извлекались из нескольких приложений. И соответственно нет возможности собрать один факт.
Если такое поведение ожидаемое, то соответственно вопрос: есть ли возможность повлиять на сегментатор? Например, установить собственный знак разделения приложений?
Я использую Windows версию Yandex Tomita-parser(build date Jan 24 2013) со страницы https://tech.yandex.ru/tomita/