nlp-survey-text2image COCO-Text: Dataset and Benchmark for Text Detection and Recognition in Natural Images

COCO-Text: Dataset and Benchmark for Text Detection and Recognition in Natural Images

Open soneo1127 opened this issue 5 years ago • 0 comments

https://arxiv.org/abs/1601.07140

MS COCOという画像データセットを元に、COCO-Textという画像内のテキスト認識のためのデータセットを公開スクリーンショット 2019-04-18 16 56 04

・MS COCOは元々テキスト指向で作られたデータセットではないため、COCO-Textはより広い分布の空間的出現を有する

legible と illegible （読めるか） English (German, French and Spanish も含む )and not English 機械印刷、手書き、それ以外などのきめ細かいカテゴリの注釈を付けた。・それまでのデータセットよりもはるかに大規模（14倍以上）

予算が限られている場合の、人員へのタスク割り当てを最適化するための戦略を提案。 OCRとクラウドワーカー（Mechanical Terk）の同時使用

アノテーションの質はエキスパートアノテーター（この論文の共著者）が評価クラウドワーカーのアノテーターは全テキスト領域の57％を検出していた。特に、判読可能なテキストの84％と判読不能なテキストの39％を検出しています。

人間でも画像中の文字認識は難しい。

Microsoft COCO: Common Objects in Context https://arxiv.org/abs/1405.0312

Apr 25 '19 06:04 soneo1127