PaddleOCR 表格结构识别在识别中文表格时的准确性

表格结构识别在识别中文表格时的准确性

Open AndyHUI711 opened this issue 3 years ago • 3 comments

使用官方表格结构预测模型识别表格，对比中文表格和英文表格，发现中文表格的结构识别效果比较差。请问，如果想要提升中文表格结构识别能力，是否要再根据中文表格进行训练。谢谢！

Aug 01 '22 09:08 AndyHUI711

使用中文表格数据重新训练是可以提升效果的。最近PP-Structurev2在研发中，也会对算法有一个升级，欢迎持续关注。

Aug 02 '22 06:08 MissPenguin

使用中文表格数据重新训练是可以提升效果的。最近PP-Structurev2在研发中，也会对算法有一个升级，欢迎持续关注。

可以在开源的模型基础上，用中文数据微调吗

Aug 05 '22 00:08 ZTurboX

可以的，这次会给出详细的表格识别模型微调文档

Aug 08 '22 15:08 littletomatodonkey

中文模型已经发布，欢迎试用

Aug 26 '22 07:08 WenmuZhou

1661939791(1)

我该如何修改这里的模型为中文路径，我试了下，直接改为lp://CDLA/picodet_lcnet_x1_0_fgd_layout_cdla_infer/config是跑不通的

Aug 31 '22 09:08 BEILOP