augmentex
augmentex copied to clipboard
Воспроизводимая ошибка "list out of index" в WordAug
Установил из репозитория, ветка branch. Из-за внутренней рандомизации алгоритма в WordAug возникает не всегда, поэтому привожу воспроизводящий код с циклом
import augmentex
import traceback
if __name__ == '__main__':
word_aug = augmentex.WordAug(
unit_prob=0.2, # Percentage of the phrase to which augmentations will be applied
min_aug=1, # Minimum number of augmentations
max_aug=5, # Maximum number of augmentations
lang="rus", # supports: "rus", "eng"
platform="pc", # supports: "pc", "mobile"
random_seed=42,
)
try:
for _ in range(100):
z1 = word_aug.augment(text='это когда в отношениях, один из партнёров насилует и истязает своего партнёра ( партнёршу) бывает абъюзив и по отношению родителей к своим детям', action='replace')
except Exception as ex:
print('Error in WordAug\n', traceback.format_exc())
Стектрейс:
...
z1 = word_aug.augment(text='это когда в отношениях, один из партнёров насилует и истязает своего партнёра ( партнёршу) бывает абъюзив и по отношению родителей к своим детям', action='replace')
File "/home/inkoziev/env_poetry/lib/python3.10/site-packages/augmentex/word.py", line 192, in augment
aug_sent_arr[idx] = self.__replace(aug_sent_arr[idx])
File "/home/inkoziev/env_poetry/lib/python3.10/site-packages/augmentex/word.py", line 134, in __replace
word_probas = self.orfo_dict.get(word[0].lower(), [[word[0]], [1.0]])
IndexError: list index out of range