Margin
Margin
所以到目前为止都没有什么进展吗?再不行我就要转战Pytorch了
我说怎么V3版本的CRNN精度不如V2版本的,原来是head这里默认去掉了中间全连接层啊!!!
告诉你一个简单方法,就是在送去文本识别之前在图像宽度方向前后padding一些空白区域,这个padding宽度大小基本上按照骨干网对图像在宽度方向的下采样倍率来取就可以了
我最近也试过RepVGG骨干网,效果连MobileNetV3还不如,基本上百度提供的这些骨干网实现应该是目前最优的了,与其替换现有的骨干网还不如思考怎样进一步优化当前骨干网更有用,同时我觉得RNN模块这部分还是有优化空间
> > 数据量太少了,默认配置是每2000iter评估一次 > >  把那个false的改为true就可以了,你是关掉了训练期间计算metric的功能
scaled_dot_product_attention算子不支持啊
大概率是llm解码器那边解码停不下来了