wwzh

[email protected]

AI coin

Results 31 comments of


wwzh

不是说yolo比ctpn速度更快准确率更高吗? 为什么 darknet-ocr又使用ctpn?

> 没有比较过，text-detect-ctpn是TF版本的ctpn，最原版的应该是caffe。你可以理解darknet-ocr文字检测是darknet框架版本的ctpn（去除了lstm层），在票据检测上有一定优势。darknet-ocr与chineseocr是两个不同的项目，只是darknet-ocr完全基于darknet框架实现，不在融合多个框架，方便部署，依赖更少，支持更多的平台，特别是arm架构。开源这些项目并不是为了发表论文，只是曾经在项目中用到或者即将用到，觉得效果还不错，就分享给大家，所以项目中没有评价模型相关的量化指标。你的检测模型darknet 并不支持，我用的darknet AB

部分图片一识别就奔溃。CUDA Error: invalid configuration argument

> @deeroad 你好，请问你是在linux环境下还是在windows环境下运行的。 win10系统无法运行这个项目，感觉有点鸡肋

请问作者在这个darknet-ocr项目中是准备放弃yolo3来检测文字了吗？

作者已经实现检测文字了，而且放出了模型，但是还没有准备好实现识别文字

请问作者在这个darknet-ocr项目中是准备放弃yolo3来检测文字了吗？

> 作者放出的模型应该是基于CTPN改的，去掉了Bilstm, 不是YOLO。 text.weights不是yolo是什么？

请问作者在这个darknet-ocr项目中是准备放弃yolo3来检测文字了吗？

> 就是去掉lstm版本的CTPN，VGG16作为特征提取网络。是的，我用opencv的dnn调用，无法检测出文字框不知道为什么作者说opencv可以用？

非常感谢！！用过最准的中文识别。

> 直接用docker程序，浏览器访问就有demo！接口封装起来也非常容易！感谢！ > 而且准确率非常高你识别的是word之类的文档吧？你试试pdf文件，身份证、车票这些热门识别呢？

求文字检测opencv 得修改方法

> > 可以直接将relu改为leaky，但是准确率会降低一部分。但是maxpool不支持不同的滑动窗口。所以要调用cv2.dnn，还得修改源码，不然输出结果就是乱码。 > > 谢谢，求训练方法思路，玩一玩，这东西挺好玩，可以干很多事情要是opencv dnn可以识别，真的就可以实际部署了

检测速度慢

看着像tiny yolo训练的？

opencv不画框

6.1版本用python opencv就可以正常运行我说的是cpp版本，只出图不画框

opencv不画框

已经解决了，换了推理代码不画框一般是因为网络输出的类别数对不上，用netron查看网络的实际输出值