ericosmic comments

Results 27 comments of


                                            ericosmic

是否可以利用OCR支持扫描版PDF

@SWHL 要做到版式恢复效果好，肯定需要对版面作更精细的识别，包括段落对齐方式，段落识别，字体大小，缩进等等，但是排版方式的自由度太大了，如果要使用机器学习或在深度学习来学习这些特征，需要非常大量的真实数据来训练才能有好的效果。

PaddleClas,图像识别部署，根据2.5文档服务化部署预测过程中出现报错

@cuicheng01 就是图像识别的串联部署，检测模型和识别模型，服务启动之后, 执行 python pipeline_http_client.py,使用官方的drink_dataset数据集的数据发送预测请求

> 英文文档推荐使用英文模型，添加`--lang='en`, 详细内容可以参考[这里](https://github.com/PaddlePaddle/PaddleOCR/blob/release%2F2.6/ppstructure/docs/quickstart.md#216-%E7%89%88%E9%9D%A2%E6%81%A2%E5%A4%8D) 使用以下命令结果是一样的 ```shell paddleocr --image_dir=ppstructure/docs/table/1.png --type=structure --recovery=true --lang='en' ```

文字识别任务fineturn，准确率为0

我在微调模型时acc也是从0开始逐渐上升，但是字典并没有修改，加载预训练模型的情况下acc难道不是应该从一个高值开始吗？

文字识别任务fineturn，准确率为0

另外我使用v3版本模型的distillation训练配置进行训练，同样的数据集，v2的模型acc最后可以到达96%，而v3的acc只能到达75%就上不去了。

一些文字在转化后存在自动换行的问题

@dothinking 是否支持对扫描pdf的转换呢？如果要支持扫描pdf转换有什么思路吗

paddledetection 单机多卡训练设置了使用其他gpu但总是自动使用第一个gpu

但是我的运行命令要求使用2-3gpu，为什么会调用第一个gpu ---- 回复的原邮件 ---- | 发件人 | ***@***.***> | | 发送日期 | 2023年10月10日 19:31 | | 收件人 | PaddlePaddle/PaddleClas ***@***.***> | | 抄送人 | ericosmic ***@***.***>, Author ***@***.***> | |...

ericosmic

是否可以利用OCR支持扫描版PDF

PaddleClas,图像识别部署，根据2.5文档服务化部署预测过程中出现报错

无法复现ppstructure 的recovery效果

文字识别任务fineturn，准确率为0

文字识别任务fineturn，准确率为0

一些文字在转化后存在自动换行的问题

paddledetection 单机多卡训练设置了使用其他gpu但总是自动使用第一个gpu