opencorpora
opencorpora copied to clipboard
Попробовать дозалить незалитое из пулов
trafficstars
Процесс слияния пулов устроен так, что если между созданием пула и слиянием у токена были правки (допустим, добавилась граммема), то пример не перельётся.
Хочется сделать скрипт, который будет по списку токенов, которые не смогли слиться:
- проверять, что разборы токена по-прежнему соответствуют типу пула,
- сливать стандартным способом с пометкой, что процесс не совсем стандартный
Потом надо будет переделать логику слияния аналогично
Дозалил вот этой правкой, при желании можно выборочно посмотреть. Я смотрел, косяков не нашёл.
Также касается случаев, когда токен был в пуле данного типа, но получил "Нет правильного разбора" и впоследствии был переразобран по словарю. Надо посчитать, сколько их.