PaddleOCR icon indicating copy to clipboard operation
PaddleOCR copied to clipboard

表格结构识别在识别中文表格时的准确性

Open AndyHUI711 opened this issue 3 years ago • 3 comments

使用官方表格结构预测模型识别表格,对比中文表格和英文表格,发现中文表格的结构识别效果比较差。 请问,如果想要提升中文表格结构识别能力,是否要再根据中文表格进行训练。 谢谢!

AndyHUI711 avatar Aug 01 '22 09:08 AndyHUI711

使用中文表格数据重新训练是可以提升效果的。最近PP-Structurev2在研发中,也会对算法有一个升级,欢迎持续关注。

MissPenguin avatar Aug 02 '22 06:08 MissPenguin

使用中文表格数据重新训练是可以提升效果的。最近PP-Structurev2在研发中,也会对算法有一个升级,欢迎持续关注。

可以在开源的模型基础上,用中文数据微调吗

ZTurboX avatar Aug 05 '22 00:08 ZTurboX

可以的,这次会给出详细的表格识别模型微调文档

littletomatodonkey avatar Aug 08 '22 15:08 littletomatodonkey

中文模型已经发布,欢迎试用

WenmuZhou avatar Aug 26 '22 07:08 WenmuZhou

1661939791(1)

我该如何修改这里的模型为中文路径,我试了下,直接改为lp://CDLA/picodet_lcnet_x1_0_fgd_layout_cdla_infer/config是跑不通的

BEILOP avatar Aug 31 '22 09:08 BEILOP