tomita-parser icon indicating copy to clipboard operation
tomita-parser copied to clipboard

Парсинг ФИО

Open presto78 opened this issue 5 years ago • 2 comments

Доброго времени суток! Парсинг ФИО с использованием kwtype fio работает только если в тексте используются фамилия, имя и отчество с заглавными буквами. Если ли возможность использовать парсер для ФИО, если весь текст написан строчными буквами? Данная задача может быть актуальна в случае распознавания текста, когда от алгоритма распознавания текст приходит в одном регистре. Или же в tomita распознавание ФИО основано не на словаре, а именно на присутствии заглавных букв в словах?

presto78 avatar Apr 25 '19 08:04 presto78

Попробуйте указать в конфиге: IgnoreUpperCase = true; Сам не пробовал, но вот тут написано, что должно помочь - src/FactExtract/Parser/common/textminerconfig.proto

ikor20 avatar Apr 25 '19 12:04 ikor20

Для истории: у меня не получилось с IgnoreUpperCase. Похоже, что это баг.

victorbocharov avatar Nov 01 '20 15:11 victorbocharov