wwzh

Results 31 comments of wwzh

> 没有比较过,text-detect-ctpn是TF版本的ctpn,最原版的应该是caffe。你可以理解darknet-ocr文字检测是darknet框架版本的ctpn(去除了lstm层),在票据检测上有一定优势。darknet-ocr与chineseocr是两个不同的项目,只是darknet-ocr完全基于darknet框架实现,不在融合多个框架,方便部署,依赖更少,支持更多的平台,特别是arm架构。开源这些项目并不是为了发表论文,只是曾经在项目中用到或者即将用到,觉得效果还不错,就分享给大家,所以项目中没有评价模型相关的量化指标。 你的检测模型darknet 并不支持,我用的darknet AB

> @deeroad 你好,请问你是在linux环境下还是在windows环境下运行的。 win10系统无法运行这个项目,感觉有点鸡肋

作者已经实现检测文字了,而且放出了模型,但是还没有准备好实现识别文字

> 作者放出的模型应该是基于CTPN改的,去掉了Bilstm, 不是YOLO。 text.weights不是yolo是什么?

> 就是去掉lstm版本的CTPN,VGG16作为特征提取网络。 是的,我用opencv的dnn调用,无法检测出文字框 不知道为什么作者说opencv可以用?

> 直接用docker程序,浏览器访问就有demo!接口封装起来也非常容易!感谢! > 而且准确率非常高 你识别的是word之类的文档吧?你试试pdf文件,身份证、车票这些热门识别呢?

> > 可以直接将relu改为leaky,但是准确率会降低一部分。但是maxpool不支持不同的滑动窗口。所以要调用cv2.dnn,还得修改源码,不然输出结果就是乱码。 > > 谢谢,求训练方法思路,玩一玩,这东西挺好玩,可以干很多事情 要是opencv dnn可以识别,真的就可以实际部署了

看着像tiny yolo训练的?

6.1版本用python opencv就可以正常运行 我说的是cpp版本,只出图不画框

已经解决了,换了推理代码 不画框一般是因为网络输出的类别数对不上,用netron查看网络的实际输出值