tanreinama
tanreinama
緑色のBoundingBoxは、jsonの「bbox」の中にある「box」の左上座標の最小値と右下座標の最大値となります。
そもそも行数とブロック数は別物の扱いでOCRしています ブロックは、単一の行として認識するのではなく、複数の行からなることも可能な、ひとまとまりの文です なので、行と行の間が開いていないと、1行=1ブロックとはなりません これは公開モデルが、縦書き横書き両対応であるためなので、モデルのファインチューニングを視野に入れてください
oh... I still get an error that I don't understand. Do you know what is wrong? I pulled and merged from the latest main.
I will sync and pull main again.
@ArthurZucker yes. this is ok.
@ArthurZucker can you review it or will you be late?
Still on the way: I have a few questions.
thanks. I was separated GPTSANJapaneseModel and GPTSANJapaneseForConditionalGeneration. Regarding the return value of GPTSANJapaneseForConditionalGeneration, using Seq2SeqMoEOutput like switch_transformers does not work. Well, this is not the encode_decode model. ``` return Seq2SeqMoEOutput(...
ready to review.
Due to the time difference, the continuation will be tomorrow