moooood

Results 9 comments of moooood

如果预测的时候不能完全在CPU上跑其实问题挺大的。。。如果想要投入生产应用,不是每个公司都能用GPU部署环境的。

dcn这块我可以使用普通的conv代替吗

我看到你的论文实验里,有去掉dcn的这组对比试验,是会掉一些精度的是吧?

You should also add an extra layer.

就是说在只做检测任务时,只是经过了常规的confidence score筛选然后过一次NMS就得到了最终的结果吗?

那这样子的话 这两个参数 0.01和0.45最后recall的值大概在86%左右,但是precision只有20多。从直观上来说,这样子的设值,必然会保留大量的冗余框,precision相对就会低很多。是这个样子的吗?

谢谢!总结一下:1.如果单纯做检测的话confidence threshold设置为0.5左右,nms threshold还是设置为0.45吗?如果要做识别那么这两个参数就是设置为0.01,0.45,这么做的话就是留下尽可能多的框给识别端的模型去做识别,即便有的框并没有框到文字区域,这样子识别端对不含有文字区域的框相当于也有一个过滤的作用;2.另外还有两个问题,我们这边想把TextBoxes最终线上落地,现在有点担心线上的效率,不知道学长是否做过相关的尝试。这边主要是担心模型复杂,响应时间不够,是否需要把基础网络换成mobilenent或者对模型做一个压缩?还有个问题是,我这边的机器性能有限,Tesla p4的卡,显存只有8G,batch_size的大小是16,不知道batch_size对最终模型训练的结果是否有影响呢? 万望回复,谢谢!

同学 可以回复我一下吗

我尝试了用Tensorflow复现了一下TextBoxes,现在单尺度300*300的输入,0.3的select_threshold,0.25的nms_threshold在icdar2013上recall只有72%,precision有81%。对一些小目标的检测效果还是不是很好。那个利用recognition调整localization的方法暂时没做,但是这个应该只影响precision的结果。 训练的过程或者模型的实现还有一些其他的trick吗