tomita-parser
tomita-parser copied to clipboard
Парсинг ФИО
Доброго времени суток! Парсинг ФИО с использованием kwtype fio работает только если в тексте используются фамилия, имя и отчество с заглавными буквами. Если ли возможность использовать парсер для ФИО, если весь текст написан строчными буквами? Данная задача может быть актуальна в случае распознавания текста, когда от алгоритма распознавания текст приходит в одном регистре. Или же в tomita распознавание ФИО основано не на словаре, а именно на присутствии заглавных букв в словах?
Попробуйте указать в конфиге:
IgnoreUpperCase = true;
Сам не пробовал, но вот тут написано, что должно помочь - src/FactExtract/Parser/common/textminerconfig.proto
Для истории: у меня не получилось с IgnoreUpperCase. Похоже, что это баг.