ocr_kor icon indicating copy to clipboard operation
ocr_kor copied to clipboard

학습 문의 드립니다.

Open pennant97 opened this issue 3 years ago • 1 comments

먼저 좋은 내용 감사 드립니다. 몇 가지 문의 좀 드리겠습니다.

TextRecognitionDataGenerator 를 통해서 basic : 9000개 , skew : 9000개, back : 3000 , dist : 3000 , blur : 3000개를 생성 했습니다. basic,skew폴더에 생성된 image및 label은 다른 폴더(back,dist,blur)에 label과 같은 label이 없습니다. 이런 데이터로 basic, skew 를 train data로 back,dist,blur를 valid 데이터하여 학습 시키면 성능이 나오나요? 쓰신글을 보면 imdb 생성한거는 train 만 생성하는 것만 나와서 validation을 3가지를 더 했습니다.

아래와 같이 처리 하면 best_accuracy가 너무 낮습니다. [42000/300000] Train loss: 0.00002, Valid loss: 15.29603, Elapsed_time: 22717.21191 Current_accuracy : 3.767, Current_norm_ED : 0.13 Best_accuracy : 4.200, Best_norm_ED : 0.13

학습시 아래와 같은 명령으로 처리 했습니다.

  • Text Gen Command python run.py -c 9000 -w 10 -f 32 -l ko --output_dir data/basic; python run.py -c 4500 -w 10 -f 32 -k 5 -rk -l ko --output_dir data/skew; python run.py -c 4500 -w 10 -f 32 -k 15 -rk -l ko --output_dir data/skew; python run.py -c 1000 -w 10 -f 32 -d 3 -do 0 -l ko --output_dir data/dist; python run.py -c 1000 -w 10 -f 32 -d 3 -do 1 -l ko --output_dir data/dist; python run.py -c 1000 -w 10 -f 32 -d 3 -do 2 -l ko --output_dir data/dist; python run.py -c 1000 -w 10 -f 32 -l ko -bl 1 --output_dir data/blur; python run.py -c 1000 -w 10 -f 32 -l ko -bl 2 --output_dir data/blur; python run.py -c 1000 -w 10 -f 32 -l ko -bl 4 --output_dir data/blur; python run.py -c 1000 -w 10 -f 32 -l ko -b 0 --output_dir data/back; python run.py -c 1000 -w 10 -f 32 -l ko -b 1 --output_dir data/back; python run.py -c 1000 -w 10 -f 32 -l ko -b 2 --output_dir data/back;

  • lmdb train/validation 생성 python3 create_lmdb_dataset.py --inputPath data/basic --gtFile data/basic/labels.txt --outputPath data_lmdb/training/basic python3 create_lmdb_dataset.py --inputPath data/skew --gtFile data/skew/labels.txt --outputPath data_lmdb/training/skew python3 create_lmdb_dataset.py --inputPath data/blur --gtFile data/blur/labels.txt --outputPath data_lmdb/validation/ python3 create_lmdb_dataset.py --inputPath data/back --gtFile data/back/labels.txt --outputPath data_lmdb/validation/ python3 create_lmdb_dataset.py --inputPath data/dist --gtFile data/dist/labels.txt --outputPath data_lmdb/validation/

  • 학습 CUDA_VISIBLE_DEVICES=0 python3 train.py --train_data data_lmdb/training --valid_data data_lmdb/validation --select_data basic-skew --batch_ratio 0.5-0.5 --Transformation TPS --FeatureExtraction ResNet --SequenceModeling BiLSTM --Prediction CTC --data_filtering_off --batch_max_length 50 --workers 0;

pennant97 avatar Apr 15 '21 04:04 pennant97

모델 및 파라미터 조합에 따라 정확도가 다르게 나왔습니다 실험 로그를 함께 올려두었으니 참고해보시면 좋을 것 같습니다

https://github.com/parksunwoo/ocr_kor/tree/master/exprement1/TPS-ResNet-BiLSTM-CTC-Seed1111 https://github.com/parksunwoo/ocr_kor/tree/master/exprement1/TPS-ResNet-BiLSTM-CTC-Seed2222 https://github.com/parksunwoo/ocr_kor/tree/master/exprement1/TPS-ResNet-BiLSTM-CTC-Seed3333

parksunwoo avatar May 19 '21 23:05 parksunwoo