PaddleOCR issues

关于Batch_size参数

2

你好，请问一下，训练集的batch_size置为16，验证集的batch_size置为128，这种设置影响最终结果吗？我的图片只有200张左右，训练集的batch_size过大时，就无法显示Loss了。

部署异常：hub install deploy/hubserving/ocr_system

1

请提供下述完整信息以便快速定位问题/Please provide the following information to quickly locate the problem - 系统环境/System Environment：Ubuntu 20 - 版本号/Version：Paddle：2.3.2 PaddleOCR：2.6 问题相关组件/Related components：paddlehub 2.1.0 - 运行指令/Command Code：hub install deploy/hubserving/ocr_system/ - 完整报错/Complete Error Message： hub...

tingxiao88

kie中ser训练

1

ser训练中前几轮次损失正常下降，后面就出现nanxxx，但是前几次的eval结果都是0.9以上 ![image](https://user-images.githubusercontent.com/67177370/202097432-dc497365-a3ba-4a0f-9190-a448b786c2f8.png)

LJY6356

DBNet loss函数

### DBNet论文中的损失函数： ![image](https://user-images.githubusercontent.com/41059771/202091490-526d7bee-846f-489b-bb5d-1192dafb5e1e.png) ![image](https://user-images.githubusercontent.com/41059771/202091545-59a45f0f-537c-4b47-a2c9-2e20bfbc0420.png) ### paddleocr里db复现代码部分的损失函数： ![image](https://user-images.githubusercontent.com/41059771/202091694-929badf4-e4fa-42da-b2a1-35d178ebf5c5.png) ### **请问，两者不一样的原因是什么呢？**

fengxiaoru

PPocrLabel标注闪退，

请提供下述完整信息以便快速定位问题/Please provide the following information to quickly locate the problem - 系统环境/System Environment：Windows - 版本号/Version：Paddle：2.3.1 PaddleOCR：2.6.0.1 问题相关组件/Related components：PPOCRLabel 2.1.1 - 运行指令/Command Code：PPOCRLabel 2.1.1 - 完整报错/Complete Error Message： File "C:\Users\happy\.conda\envs\pytorch\lib\site-packages\PPOCRLabel\libs\canvas.py", line...

htaoruan

修复非utf-8平台配置文件解析异常。

2

修改此问题有2个方案： 1. 方案1，直接默认使用utf-8编码，强制固化。可能会带来另外的问题，如：用户把config.yml文件修改成其他编码格式会再次出现异常。 2. 方案2，引入chardet这类插件来动态进行编码格式转换，能从根本上解决此类问题，但是需要引入第三方包。综合考虑选择方案1，因使用此项目的对象是研发人员，相对而言他的副作用相对较小。

zhenliangli

contributor

文本检测DB算法请教

看了一下PPOCR，DBNet文本检测部分的代码，训练时候使用了step_function函数来计算文本区域的二值化图，为什么预测时候是直接使用概率图然后利用一个固定的阈值0.3来得到二值化图，而没有用到模型预测阈值图结合step_function计算二值图，是为了推理速度的考虑吗？但是这样做对于模型的精度会不会有影响？

xiulianzw

修复测试服务中图片转Base64的引用地址错误。

2

现有的Markdown文档中引用地址多了一个括号导致无法正常打开页面。

zhenliangli

contributor

status: proposed

训练检测模型，和识别模型，图片上有英文，梵文，只想要英文部分，梵文可以不标注么？

类似上图。我标注检测框的时候可以标注全部吧。但是文字是不是可以只写英文？还是需要全写呢？顺便问下：假如说我想识别梵文+英文的话。是分开训练识别模型么。不同文字分开识别？还是创建一个多语言的字典一同训练呢？

cumthxy

paddleocr 后续能结合语义识别吗？

请提供下述完整信息以便快速定位问题/Please provide the following information to quickly locate the problem - 系统环境/System Environment： - 版本号/Version：Paddle： PaddleOCR：问题相关组件/Related components： - 运行指令/Command Code： - 完整报错/Complete Error Message： paddleocr 后续能结合语义识别吗

calvinxuman

PaddleOCR
PaddleOCR copied to clipboard

Metadata

关于Batch_size参数

部署异常：hub install deploy/hubserving/ocr_system

kie中ser训练

DBNet loss函数

PPocrLabel标注闪退，

修复非utf-8平台配置文件解析异常。

文本检测DB算法请教

修复测试服务中图片转Base64的引用地址错误。

训练检测模型，和识别模型，图片上有英文，梵文，只想要英文部分，梵文可以不标注么？

paddleocr 后续能结合语义识别吗？

← Metadata

Owner

Metadata

PaddleOCR PaddleOCR copied to clipboard

Metadata

← Metadata

Owner

Metadata

PaddleOCR
PaddleOCR copied to clipboard