Sunflower7788

Results 107 comments of Sunflower7788

您好,非常理解您的心情,但算法模型是无法完美100%解决所有的真实场景的问题,请您理解。如果您方便的话,可以把原图附上,我们会尽力看下是不是可以通过一些后处理参数来解决。如果不能解决的话,如果您愿意,可以给我们提供一部分这样的数据优化我们这一部分的能力,之后的版本中更好解决您的问题,非常感谢!

1. You can use a layout detection model to crop out individual elements. As mentioned above, you can use the PP-DocLayoutV2 model for this purpose. Then, you can annotate each...

您好,表格一般我们建议使用PPOCRLabel标注,这里有标注的教程。标注完成后会保留html格式的表格。使用脚本将HTML格式转化为OTSL格式即可。https://github.com/PaddlePaddle/PaddleX/blob/18e94f852749b27e2e70abfd3a646d1ddccee478/docs/data_annotations/ocr_modules/table_recognition.md 脚本如下: [html_to_otsl.py](https://github.com/user-attachments/files/24203712/html_to_otsl.py) 另外表格微调案例在准备中,ready后会发布,感谢您的持续关注。

use_doc_orientation_classify True --use_doc_unwarping True 这个尝试设置成False试试看。

您好,数据量比较少确实会无法学习到具体的特征,可以试下训练集和验证集完全一致的时候,能够收敛,如果不能或者降低学习率尝试下,看看能否拟合。