jiangguisyp
jiangguisyp
> 在nms.py中,不知我理解的对不对,特征图shape为:(184, 160),先行后列合并激活像素,得到group D,接下来就是计算每个区域坐标和得分,这块代码没有看懂。 > > 实际上,scipy.ndimage.label连通区域与opencv计算矩形区域,特征图与原图缩放比例为4,可以直接得到预测区域坐标。但是这样区域尺度上与nms计算不一致。。。 > > 有没有解答一下的? 特征图上的激活像素并不对应着 文本区域,也不是对应着缩放的4倍的文本区域,每个激活其实都是一个框,一个连通域有很多个激活像素,也就是很多预测框,作者没有采用先把框预测出来,再用nms来融合的策略,而是先融合激活像素的值,最终预测出一个框。
> @Shiyi19971017 你好,请问解决了么 这个是你生成的,按照README中的步骤,修改cfg中的值,然后依次运行preprocess.py, label.py,advanced_east.py就可以训练,train_3T736.txt是你指定了训练尺寸是736后,运行preprocess后就能生成了
>  > 第一轮都是百分之百了 搞不懂哪里有问题 有没有大神指教一下 很可能是标签出问题了。