tanreinama

Results 19 comments of tanreinama

緑色のBoundingBoxは、jsonの「bbox」の中にある「box」の左上座標の最小値と右下座標の最大値となります。

そもそも行数とブロック数は別物の扱いでOCRしています ブロックは、単一の行として認識するのではなく、複数の行からなることも可能な、ひとまとまりの文です なので、行と行の間が開いていないと、1行=1ブロックとはなりません これは公開モデルが、縦書き横書き両対応であるためなので、モデルのファインチューニングを視野に入れてください

oh... I still get an error that I don't understand. Do you know what is wrong? I pulled and merged from the latest main.

I will sync and pull main again.

@ArthurZucker yes. this is ok.

@ArthurZucker can you review it or will you be late?

Still on the way: I have a few questions.

thanks. I was separated GPTSANJapaneseModel and GPTSANJapaneseForConditionalGeneration. Regarding the return value of GPTSANJapaneseForConditionalGeneration, using Seq2SeqMoEOutput like switch_transformers does not work. Well, this is not the encode_decode model. ``` return Seq2SeqMoEOutput(...

Due to the time difference, the continuation will be tomorrow