Wang Xinyu
Wang Xinyu
代码中的一些问题及解决
作者的代码很棒,但是这几天我在实际的实验中遇到了一些问题并进行了其他几处改进,在这里分享一下。 1. eval失败。解决:script.py文件中16,17行改为 'GT_SAMPLE_NAME_2_ID': 'gt_img_([0-9]+).txt', 'DET_SAMPLE_NAME_2_ID': 'res_img_([0-9]+).txt' 2. 其他python版本编译pse.so出错。我修改makefile文件编译成功了。详情见:https://blog.csdn.net/ab0902cd/article/details/88352417 3. 训练过程中writer保存了很多图片,但是我感觉用不到,而且保存图片后log文件会很大,可以添加一个if条件。例如添加: if config.display_input_images: 4. scale设置2或4时报错,尺寸不匹配。原因是模型得到的图是160x160,但是label图是640x640的。 解决:看了一下原作者的代码,train时不设置scale,test时设置scale。 ``` if self.train: x = F.interpolate(x, size=(H, W), mode='bilinear', align_corners=True) else: x = F.interpolate(x,...
 
看到论文里说 > During training, we ignore the blurred text regions labeled as DO NOT CARE in all datasets. IC15的数据集读取忽略了DO NOT CARE,但是看到读取CTW的代码里tag都是true,会对结果有影响吗? 另外Total-text考虑DO NOT CARE吗?