FEDOT icon indicating copy to clipboard operation
FEDOT copied to clipboard

Balanced / unbalanced data

Open MAGLeb opened this issue 3 years ago • 2 comments

chain_evo_composed = composer.compose_chain(data=input_data, is_visualise=True)

Got error: ValueError: Only one class present in y_true. ROC AUC score is not defined in that case.

In my case binary classification with 620k objects and only 30k equal ones. 5% ones in the target variable.

MAGLeb avatar Jul 17 '21 07:07 MAGLeb

Попробуй добавить внутри composer в train_test_data_setup установку shuffle_flag как True. Раньше это было так, видимо затерлось при каких-то правках.

nicl-nno avatar Jul 18 '21 22:07 nicl-nno

Может быть написать функцию, которая будет делить сбалансированно данные на train and test опираясь на таргет. Аналогичная ошибка падает, когда вызываю метод fine_tune_all_nodes.

MAGLeb avatar Jul 21 '21 04:07 MAGLeb

В https://github.com/aimclub/FEDOT/pull/1138 включена стратификация при разделении данных на выборки для задач классификации. Проблема должна быть исчерпана.

kasyanovse avatar Aug 23 '23 13:08 kasyanovse