tomita-parser icon indicating copy to clipboard operation
tomita-parser copied to clipboard

Своебразно работает сегментатор

Open whalebot-helmsman opened this issue 8 years ago • 4 comments

Простой текст с адресом

г. Москва ул. Порываева, дом 22, корп.1, кв. 23

Сегментатор разбивает на 4 предложения

г . EOS Москва ул . EOS Порываева , дом 22 , корп.1 , кв . EOS 31 EOS

Правильно ли я понимаю, что нет возможности создавать грамматические правила, которые бы извлекались из нескольких приложений. И соответственно нет возможности собрать один факт.

Если такое поведение ожидаемое, то соответственно вопрос: есть ли возможность повлиять на сегментатор? Например, установить собственный знак разделения приложений?

Я использую Windows версию Yandex Tomita-parser(build date Jan 24 2013) со страницы https://tech.yandex.ru/tomita/

whalebot-helmsman avatar Jun 24 '16 13:06 whalebot-helmsman