opencorpora
opencorpora copied to clipboard
Удалить дубликаты отчеств
Найти и удалить дубликаты отчеств. Например, сейчас в словаре три отчества юриевич: первое от имени юрий, второе -- от имени юри, третье -- от имени юрие. То же самое для женского рода. Таких примеров вижу много: антонович (от антона и антоно), георгиевич (от георгия и георги), савелиевич, робертович, леонардович, альбертович, эдуардович, фредерикович и т. д.
Привет, я спрошу по поводу отчеств, если можно.
Есть имя - Василий, в его связях сейчас прописано отчество Васил-и-евич, а не Васил-ь-евич- http://opencorpora.org/dict.php?act=edit&id=39028
Так сделано специально или это ошибка?
Там внутри парадигмы есть формы на -ь- Насколько я помню, при выборе леммы берётся более "нормативная" (кроме того, что это должно быть nomn&sing, разумеется). А более нормативная - это та, где меньше граммем. А граммем меньше у формы "василиевич". Получилось немного странно.
(таких пар отчеств около 260 шт.)
Сделал. Пропустил непонятные случаи:
- алесевна (от Алесь и
Infrот (опечаточного?) Алесей) - андревна
- михаловна
Также остались на месте Юриевич и Юриевна (по 1 экз.) из-за того, что у них с Юрьевичем/Юрьевной разные леммы.