PaddleOCR
PaddleOCR copied to clipboard
表格结构识别在识别中文表格时的准确性
使用官方表格结构预测模型识别表格,对比中文表格和英文表格,发现中文表格的结构识别效果比较差。 请问,如果想要提升中文表格结构识别能力,是否要再根据中文表格进行训练。 谢谢!
使用中文表格数据重新训练是可以提升效果的。最近PP-Structurev2在研发中,也会对算法有一个升级,欢迎持续关注。
使用中文表格数据重新训练是可以提升效果的。最近PP-Structurev2在研发中,也会对算法有一个升级,欢迎持续关注。
可以在开源的模型基础上,用中文数据微调吗
可以的,这次会给出详细的表格识别模型微调文档
中文模型已经发布,欢迎试用
我该如何修改这里的模型为中文路径,我试了下,直接改为lp://CDLA/picodet_lcnet_x1_0_fgd_layout_cdla_infer/config是跑不通的