kingqiuol
kingqiuol
> 训练了29个epoch 最优的模型验证准确率一直是0 是我训练的轮次太少了吗 transformer一般前十个轮次就很高了,29epoch还为0就要检查下了,标签是不是对,或者模型是否加载对,最后是这个CoMER推理模型就是个坑需要自己改一下
> 该算法是基于图像的公式识别,我就想它是否可以基于图片进行文本识别。 > > 使用了单行的的文本数据3w+,也替换了dictionary.txt(仅包括样本中出现的字符),但是准确率一直为0,这是哪里有问题吗? 可以肯定,优于现有文本行识别方法,如CRNN,至于结果,我觉得还是检测标签格式啥的,其次是推理过程模型加载以及解码过程都需要注意
多卡的话,就DDP,半精度在数据量足够多用(10w以上吧),不然会不收敛
> bash eval_all.sh的时候,是否遇到这样的报错呢?我确认我是导入了comer了的  自己添加下环境就行吧 import sys sys.path.append(xxxxxx) # 当前CoMER文件夹路径