AdvancedLiterateMachinery icon indicating copy to clipboard operation
AdvancedLiterateMachinery copied to clipboard

geolayoutLM中文的bbox应该选用什么级别的?

Open cenzeng666 opened this issue 1 year ago • 1 comments
trafficstars

我看geolayoutLM在英文上需要单词级别的bbox作为模型输入。 那么请问开源在modelscope上的中文预训练模型,中文的bbox是如何构建的?分词级别还是字符级别?

cenzeng666 avatar Nov 27 '23 05:11 cenzeng666

我看geolayoutLM在英文上需要单词级别的bbox作为模型输入。 那么请问开源在modelscope上的中文预训练模型,中文的bbox是如何构建的?分词级别还是字符级别?

行级别和字符级别。不需要分词级别的。

luochuwei avatar Nov 28 '23 03:11 luochuwei