opencorpora icon indicating copy to clipboard operation
opencorpora copied to clipboard

Удалить дубликаты отчеств

Open Shimorina opened this issue 8 years ago • 4 comments
trafficstars

Найти и удалить дубликаты отчеств. Например, сейчас в словаре три отчества юриевич: первое от имени юрий, второе -- от имени юри, третье -- от имени юрие. То же самое для женского рода. Таких примеров вижу много: антонович (от антона и антоно), георгиевич (от георгия и георги), савелиевич, робертович, леонардович, альбертович, эдуардович, фредерикович и т. д.

Shimorina avatar May 22 '17 21:05 Shimorina

Привет, я спрошу по поводу отчеств, если можно. Есть имя - Василий, в его связях сейчас прописано отчество Васил-и-евич, а не Васил-ь-евич- http://opencorpora.org/dict.php?act=edit&id=39028 Так сделано специально или это ошибка?

dveselov avatar May 23 '17 06:05 dveselov

Там внутри парадигмы есть формы на -ь- Насколько я помню, при выборе леммы берётся более "нормативная" (кроме того, что это должно быть nomn&sing, разумеется). А более нормативная - это та, где меньше граммем. А граммем меньше у формы "василиевич". Получилось немного странно.

victorbocharov avatar May 23 '17 07:05 victorbocharov

(таких пар отчеств около 260 шт.)

Shimorina avatar Jun 16 '17 16:06 Shimorina

Сделал. Пропустил непонятные случаи:

  • алесевна (от Алесь и Infr от (опечаточного?) Алесей)
  • андревна
  • михаловна

Также остались на месте Юриевич и Юриевна (по 1 экз.) из-за того, что у них с Юрьевичем/Юрьевной разные леммы.

grandsbor avatar May 03 '19 09:05 grandsbor