augmentex icon indicating copy to clipboard operation
augmentex copied to clipboard

Воспроизводимая ошибка "list out of index" в WordAug

Open Koziev opened this issue 6 months ago • 0 comments

Установил из репозитория, ветка branch. Из-за внутренней рандомизации алгоритма в WordAug возникает не всегда, поэтому привожу воспроизводящий код с циклом

import augmentex
import traceback


if __name__ == '__main__':
    word_aug = augmentex.WordAug(
        unit_prob=0.2,  # Percentage of the phrase to which augmentations will be applied
        min_aug=1,  # Minimum number of augmentations
        max_aug=5,  # Maximum number of augmentations
        lang="rus",  # supports: "rus", "eng"
        platform="pc",  # supports: "pc", "mobile"
        random_seed=42,
    )

    try:
        for _ in range(100):
            z1 = word_aug.augment(text='это когда в отношениях, один из партнёров насилует и истязает своего партнёра ( партнёршу) бывает абъюзив и по отношению родителей к своим детям', action='replace')
    except Exception as ex:
        print('Error in WordAug\n', traceback.format_exc())

Стектрейс:

 ...
    z1 = word_aug.augment(text='это когда в отношениях, один из партнёров насилует и истязает своего партнёра ( партнёршу) бывает абъюзив и по отношению родителей к своим детям', action='replace')
  File "/home/inkoziev/env_poetry/lib/python3.10/site-packages/augmentex/word.py", line 192, in augment
    aug_sent_arr[idx] = self.__replace(aug_sent_arr[idx])
  File "/home/inkoziev/env_poetry/lib/python3.10/site-packages/augmentex/word.py", line 134, in __replace
    word_probas = self.orfo_dict.get(word[0].lower(), [[word[0]], [1.0]])
IndexError: list index out of range

Koziev avatar Aug 09 '24 06:08 Koziev