candler
candler
还没,你可以试试
R2CNN针对icdar2015的task 1 : text localization 对应的gt没有前面那两个0
@gittigxuy 不论是py-faster-rcnn还是R2CNN,dataset下面的pascal_voc.py(或icdar.py)目的都是一样的,都是找到xml文件,R2CNN之所以用merge_train.txt是因为R2CNN的原始paper中有一个data augmentation的操作,所以merge_train.txt不仅包括了原始的icdar2015+icdar2013的数据,还包括了augmentation之后的数据(详见论文及R2CNN的README.md)。
1. 我的xml格式跟tensorflow版本的是一样的,都是四个点的坐标(八个数值)。 2. ,可以看到你给出的框是水平框(x,y,width,height),不符合R2CNN和tensorflow版本的要求。 另外,我这里有一份已经生成好的roid_data,你可以直接拿过来训练。 [roid_data](https://pan.baidu.com/s/1Pok-AYU0Jl-DNKrSqF3vNg#list/path=%2FRRCNN%2Fcache_roidb_data&parentPath=%2F) 另外,工作日比较忙,回复不及时,请见谅。