hpc203

Results 114 comments of hpc203

可以的,需要安装onnxruntime库

> > 需要安装onnxruntime库 > > 大佬,有没有参考?我试过了通过chinese_lite里面的dbnet识别的代码,但是识别为空。可否放出cpp的参考? 在chinese_lite里面的dbnet的c++代码里,预处理包括resize,减均值除方差的归一化操作,而我发布的这套代码里,预处理包括转换通道至RGB,除以255,减均值除方差的归一化操作。可见这两套程序的预处理是有差别的,修改chinese_lite里面的dbnet的预处理代码,再运行试试

> > 需要安装onnxruntime库 > > 大佬,有没有参考?我试过了通过chinese_lite里面的dbnet识别的代码,但是识别为空。可否放出cpp的参考? 已添加C++版本的程序

> ort_session = new Session(env, widestr.c_str(), sessionOptions); 这个是不同平台的onnxruntime加载模型文件的差异造成的,我的代码是在windows平台里编译运行的。如果在linux系统里编译,需要把 ort_session = new Session(env, widestr.c_str(), sessionOptions); 改成 ort_session = new Session(env, model_path.c_str(), sessionOptions); 并且把widestr有关的代码去掉,然后编译运行,你可以加一个宏定义开关来自由切换windows系统和linux系统

对的,resize需要是动态高宽的,因为有的文字很长,而有的文字有的很短,如果resize固定高宽的,那在输入长段文字时,会出现末尾的文字无法识别出来的。文字检测模块和文字识别模块都要使用保持高宽比的resize,而且文字检测模块resize之后的高宽需要是32的倍数,这样的效果才会更好。此外,这套代码已经挺旧了,可以更换到PaddleOCR-v4 ---原始邮件--- 发件人: ***@***.***> 发送时间: 2024年1月29日(周一) 下午5:27 收件人: ***@***.***>; 抄送: ***@***.***>; 主题: [hpc203/PaddleOCR-v3-onnxrun-cpp-py] 我发现代码存在问题,且识别效果很差 (Issue #11) 最近闲来无事,把PaddleOCR官方代码和博主的代码都看了一遍(不得不吐槽下官方代码有些地方就是不想让你看懂,一些关键步骤都藏起来),自己把onnx推理代码完全重写一遍,相比官方代码的推理速度提升30%以上,内存占用缩小30%以上,效果显著! 博主代码中最主要的问题是,**文字识别步骤中图片预处理方式**不对,比如我一张600*24尺寸的图片,经过上述方式就变成320*48尺寸了,图片完全变形,导致识别不出来。所以改掉这一步,识别效果能好很多,还有些其它来自官方代码的问题就不多说了。 — Reply to this email directly, view it on GitHub, or unsubscribe....

从paddleocr官方仓库下载模型,执行pdaddle2onnx转换生成onnx文件,然后现在的程序里加载v4的onnx文件就可以的呀,代码不用改的,可能图像预处理函数要修改一下 ---原始邮件--- 发件人: ***@***.***> 发送时间: 2024年5月11日(周六) 中午1:40 收件人: ***@***.***>; 抄送: ***@***.******@***.***>; 主题: Re: [hpc203/PaddleOCR-v3-onnxrun-cpp-py] 我发现代码存在问题,且识别效果很差 (Issue #11) 亲 可以针对paddleocr v4开个onnxruntime cpp reference的源代码不 感谢感谢! 我是用的python代码改写,自己也不擅长C++,所以并没有C++实现的代码,如果你需要python实现的代码,我可以发你一份和相关模型,再根据我的代码思路用C++实现。 — Reply to this email directly,...

图片预处理,要写成动态分辨率保持高宽比的的这种形式的,宽度是动态的。因为一行文字有长又短的情况,如果是固定分辨率的,那么在输入一行很长的文字图片的时候,文字图片的宽度大于输入宽度,那么识别文字就会有遗漏的,这个特别要注意 ---原始邮件--- 发件人: ***@***.***> 发送时间: 2024年5月12日(周日) 中午1:26 收件人: ***@***.***>; 抄送: ***@***.******@***.***>; 主题: Re: [hpc203/PaddleOCR-v3-onnxrun-cpp-py] 我发现代码存在问题,且识别效果很差 (Issue #11) 嗯嗯 是的 预处理还比较复杂 v4的检测给出的是4个点的的识别结果 然后做了一遍透视变换 然后到了检测这边还做了一次resize 总之还比较复杂 需要根据python源代码来改写c++ 从paddleocr官方仓库下载模型,执行pdaddle2onnx转换生成onnx文件,然后现在的程序里加载v4的onnx文件就可以的呀,代码不用改的,可能图像预处理函数要修改一下 … ---原始邮件--- 发件人: @.>...

是的,文字检测和文字识别模块,输入分辨率要是动态的,并且在检测模块,输入的高宽是32的倍数,这样才会取得好的效果 ---原始邮件--- 发件人: ***@***.***> 发送时间: 2024年8月14日(周三) 上午9:23 收件人: ***@***.***>; 抄送: ***@***.******@***.***>; 主题: Re: [hpc203/PaddleOCR-v3-onnxrun-cpp-py] 我发现代码存在问题,且识别效果很差 (Issue #11) 亲 可以针对paddleocr v4开个onnxruntime cpp reference的源代码不 感谢感谢! 我是用的python代码改写,自己也不擅长C++,所以并没有C++实现的代码,如果你需要python实现的代码,我可以发你一份和相关模型,再根据我的代码思路用C++实现。 ***@***.***,感谢! 我已经将代码放到我的GitHub仓库里了,仓库地址----> https://github.com/lasifea/simple-vision-tasks 非常感谢! — Reply...

根据检测框的y轴坐标,从小到大排序,这样的检测框,就是从上到下了。你可以在源码里添加这个步骤呀 ---原始邮件--- 发件人: ***@***.***> 发送时间: 2023年4月13日(周四) 下午5:42 收件人: ***@***.***>; 抄送: ***@***.***>; 主题: [hpc203/PaddleOCR-v3-onnxrun-cpp-py] 识别结果为什么从下到上呀,应该怎么改,才正确? (Issue #2) 主席、当代作家贯平四之女 OpenCV与AI深度学习 西北大学文学院制教技,西开年文学协主席,中国作协 贯浅,女、汉旗,091月出生,当代作家、人 我,尿了一个坑! woniao le yige keng 你,尿了一条线, ni niao le yi...

> Windows paddlepaddle-gpu 2.3 cuda10.1 cudnn7.6.5 > > 对main.py做了如下的修改: > > ```python > import time > import paddle > import cv2 > import numpy as np > import argparse >...