hpc203

https://blog.csdn.net/nihate [email protected]

xTool 深圳深度学习算法工程师 https://zhuanlan.zhihu.com/p/466677699

Results 114 comments of


                                            hpc203

> > 需要安装onnxruntime库 > > 大佬，有没有参考？我试过了通过chinese_lite里面的dbnet识别的代码，但是识别为空。可否放出cpp的参考？在chinese_lite里面的dbnet的c++代码里，预处理包括resize，减均值除方差的归一化操作，而我发布的这套代码里，预处理包括转换通道至RGB，除以255，减均值除方差的归一化操作。可见这两套程序的预处理是有差别的，修改chinese_lite里面的dbnet的预处理代码，再运行试试

大神好，可以转C++不？

> > 需要安装onnxruntime库 > > 大佬，有没有参考？我试过了通过chinese_lite里面的dbnet识别的代码，但是识别为空。可否放出cpp的参考？已添加C++版本的程序

onnxruntime版本？

> ort_session = new Session(env, widestr.c_str(), sessionOptions); 这个是不同平台的onnxruntime加载模型文件的差异造成的，我的代码是在windows平台里编译运行的。如果在linux系统里编译，需要把 ort_session = new Session(env, widestr.c_str(), sessionOptions); 改成 ort_session = new Session(env, model_path.c_str(), sessionOptions); 并且把widestr有关的代码去掉，然后编译运行，你可以加一个宏定义开关来自由切换windows系统和linux系统

我发现代码存在问题，且识别效果很差

对的，resize需要是动态高宽的，因为有的文字很长，而有的文字有的很短，如果resize固定高宽的，那在输入长段文字时，会出现末尾的文字无法识别出来的。文字检测模块和文字识别模块都要使用保持高宽比的resize，而且文字检测模块resize之后的高宽需要是32的倍数，这样的效果才会更好。此外，这套代码已经挺旧了，可以更换到PaddleOCR-v4 ---原始邮件--- 发件人: ***@***.***> 发送时间: 2024年1月29日(周一) 下午5:27 收件人: ***@***.***>; 抄送: ***@***.***>; 主题: [hpc203/PaddleOCR-v3-onnxrun-cpp-py] 我发现代码存在问题，且识别效果很差 (Issue #11) 最近闲来无事，把PaddleOCR官方代码和博主的代码都看了一遍（不得不吐槽下官方代码有些地方就是不想让你看懂，一些关键步骤都藏起来），自己把onnx推理代码完全重写一遍，相比官方代码的推理速度提升30%以上，内存占用缩小30%以上，效果显著！博主代码中最主要的问题是，**文字识别步骤中图片预处理方式**不对，比如我一张600*24尺寸的图片，经过上述方式就变成320*48尺寸了，图片完全变形，导致识别不出来。所以改掉这一步，识别效果能好很多，还有些其它来自官方代码的问题就不多说了。 — Reply to this email directly, view it on GitHub, or unsubscribe....

我发现代码存在问题，且识别效果很差

从paddleocr官方仓库下载模型，执行pdaddle2onnx转换生成onnx文件，然后现在的程序里加载v4的onnx文件就可以的呀，代码不用改的，可能图像预处理函数要修改一下 ---原始邮件--- 发件人: ***@***.***> 发送时间: 2024年5月11日(周六) 中午1:40 收件人: ***@***.***>; 抄送: ***@***.******@***.***>; 主题: Re: [hpc203/PaddleOCR-v3-onnxrun-cpp-py] 我发现代码存在问题，且识别效果很差 (Issue #11) 亲可以针对paddleocr v4开个onnxruntime cpp reference的源代码不感谢感谢！我是用的python代码改写，自己也不擅长C++，所以并没有C++实现的代码，如果你需要python实现的代码，我可以发你一份和相关模型，再根据我的代码思路用C++实现。 — Reply to this email directly,...

我发现代码存在问题，且识别效果很差

图片预处理，要写成动态分辨率保持高宽比的的这种形式的，宽度是动态的。因为一行文字有长又短的情况，如果是固定分辨率的，那么在输入一行很长的文字图片的时候，文字图片的宽度大于输入宽度，那么识别文字就会有遗漏的，这个特别要注意 ---原始邮件--- 发件人: ***@***.***> 发送时间: 2024年5月12日(周日) 中午1:26 收件人: ***@***.***>; 抄送: ***@***.******@***.***>; 主题: Re: [hpc203/PaddleOCR-v3-onnxrun-cpp-py] 我发现代码存在问题，且识别效果很差 (Issue #11) 嗯嗯是的预处理还比较复杂 v4的检测给出的是4个点的的识别结果然后做了一遍透视变换然后到了检测这边还做了一次resize 总之还比较复杂需要根据python源代码来改写c++ 从paddleocr官方仓库下载模型，执行pdaddle2onnx转换生成onnx文件，然后现在的程序里加载v4的onnx文件就可以的呀，代码不用改的，可能图像预处理函数要修改一下 … ---原始邮件--- 发件人: @.>...

我发现代码存在问题，且识别效果很差

是的，文字检测和文字识别模块，输入分辨率要是动态的，并且在检测模块，输入的高宽是32的倍数，这样才会取得好的效果 ---原始邮件--- 发件人: ***@***.***> 发送时间: 2024年8月14日(周三) 上午9:23 收件人: ***@***.***>; 抄送: ***@***.******@***.***>; 主题: Re: [hpc203/PaddleOCR-v3-onnxrun-cpp-py] 我发现代码存在问题，且识别效果很差 (Issue #11) 亲可以针对paddleocr v4开个onnxruntime cpp reference的源代码不感谢感谢！我是用的python代码改写，自己也不擅长C++，所以并没有C++实现的代码，如果你需要python实现的代码，我可以发你一份和相关模型，再根据我的代码思路用C++实现。 ***@***.***，感谢！我已经将代码放到我的GitHub仓库里了，仓库地址----> https://github.com/lasifea/simple-vision-tasks 非常感谢！ — Reply...

识别结果为什么从下到上呀，应该怎么改，才正确？

根据检测框的y轴坐标，从小到大排序，这样的检测框，就是从上到下了。你可以在源码里添加这个步骤呀 ---原始邮件--- 发件人: ***@***.***> 发送时间: 2023年4月13日(周四) 下午5:42 收件人: ***@***.***>; 抄送: ***@***.***>; 主题: [hpc203/PaddleOCR-v3-onnxrun-cpp-py] 识别结果为什么从下到上呀，应该怎么改，才正确？ (Issue #2) 主席、当代作家贯平四之女 OpenCV与AI深度学习西北大学文学院制教技，西开年文学协主席，中国作协贯浅，女、汉旗，091月出生，当代作家、人我，尿了一个坑！ woniao le yige keng 你，尿了一条线， ni niao le yi...

关于我修改了代码后只能达到6fps

> Windows paddlepaddle-gpu 2.3 cuda10.1 cudnn7.6.5 > > 对main.py做了如下的修改： > > ```python > import time > import paddle > import cv2 > import numpy as np > import argparse >...