PaddleOCR icon indicating copy to clipboard operation
PaddleOCR copied to clipboard

表格识别两个单元格文字靠得很近识别成一个单元格

Open hf62580 opened this issue 1 year ago • 2 comments

表格识别两个单元格文字靠得很近识别成一个单元格 QQ截图20240227183113 比如第二行会识别成

050020996923174000253美诺速冻薯条800g袋12|112. 00015. 00000 这个有没有什么改善的方法

hf62580 avatar Feb 27 '24 11:02 hf62580

050020996923174000253合并成一个单元格了,而不是分开两个

hf62580 avatar Feb 27 '24 11:02 hf62580

感谢关注,目前表格识别模型的精度不够准确,我们还在优化可以期待下一个版本的模型效果。

tink2123 avatar Feb 28 '24 06:02 tink2123

@tink2123 其他模型都不错,现有所有模型中,表格识别模型准确率精度的确达不到,下面这张图中混合多种情况,现有模型没办法完美识别和还原 image

zhuxiaobin avatar Mar 03 '24 12:03 zhuxiaobin

感谢关注,目前表格识别模型的精度不够准确,我们还在优化可以期待下一个版本的模型效果。

@tink2123 请问下一个版本大概什么时候会更新呢? 以及对于表格识别有什么优化的思路和建议么?可以推荐一些表格识别效果较好的开源模型么?谢谢

zhangqiqi1228 avatar Mar 05 '24 06:03 zhangqiqi1228

下一个版本预计会在4月中旬发布,目前中文开源表格模型,可以试一下TableMaster。 另外大模型领域也都在做表格识别,感兴趣也可以关注一下

tink2123 avatar Mar 05 '24 13:03 tink2123

@tink2123 可以推荐一些表格识别效果较好的英文开源模型么?

jiayan2024 avatar Apr 09 '24 07:04 jiayan2024

下一个版本预计会在4月中旬发布,目前中文开源表格模型,可以试一下TableMaster。 另外大模型领域也都在做表格识别,感兴趣也可以关注一下

请问下一个版本什么时候发布

hf62580 avatar Apr 15 '24 11:04 hf62580