ericosmic
ericosmic
@SWHL 要做到版式恢复效果好,肯定需要对版面作更精细的识别,包括段落对齐方式,段落识别,字体大小,缩进等等,但是排版方式的自由度太大了,如果要使用机器学习或在深度学习来学习这些特征,需要非常大量的真实数据来训练才能有好的效果。
@cuicheng01 就是图像识别的串联部署,检测模型和识别模型,服务启动之后, 执行 python pipeline_http_client.py,使用官方的drink_dataset数据集的数据发送预测请求
> 英文文档推荐使用英文模型,添加`--lang='en`, 详细内容可以参考[这里](https://github.com/PaddlePaddle/PaddleOCR/blob/release%2F2.6/ppstructure/docs/quickstart.md#216-%E7%89%88%E9%9D%A2%E6%81%A2%E5%A4%8D) 使用以下命令结果是一样的 ```shell paddleocr --image_dir=ppstructure/docs/table/1.png --type=structure --recovery=true --lang='en' ```
我在微调模型时acc也是从0开始逐渐上升,但是字典并没有修改,加载预训练模型的情况下acc难道不是应该从一个高值开始吗?
另外我使用v3版本模型的distillation训练配置进行训练,同样的数据集,v2的模型acc最后可以到达96%, 而v3的acc只能到达75%就上不去了。
@dothinking 是否支持对扫描pdf的转换呢? 如果要支持扫描pdf转换有什么思路吗
但是我的运行命令要求使用2-3gpu,为什么会调用第一个gpu ---- 回复的原邮件 ---- | 发件人 | ***@***.***> | | 发送日期 | 2023年10月10日 19:31 | | 收件人 | PaddlePaddle/PaddleClas ***@***.***> | | 抄送人 | ericosmic ***@***.***>, Author ***@***.***> | |...