R2CNN
R2CNN copied to clipboard
用R2CNN训练自己的数据集遇到了问题
icdar.py当中看到了两个txt文件,在py-faster rcnn当中会在ImageSets/Main生成trainval.txt,这个trainval.txt对应图片当中的哪个文件呢?merge_train.txt里面的内容是什么呢?
自认为py-faster rcnn当中会在ImageSets/Main生成trainval.txt和merge_train.txt是同一个文件,在icdar.py当中解析xml文件的时候,我自己生成的xml文件和作者你解析xml文件的_load_icdar_annotaion函数结构不太一样,可否将icdar 2015的生成xml文件的代码发送到[email protected],谢谢作者了
附上我生成的xml文件的截图
请问一下为什么cross point不存在
@gittigxuy 不论是py-faster-rcnn还是R2CNN,dataset下面的pascal_voc.py(或icdar.py)目的都是一样的,都是找到xml文件,R2CNN之所以用merge_train.txt是因为R2CNN的原始paper中有一个data augmentation的操作,所以merge_train.txt不仅包括了原始的icdar2015+icdar2013的数据,还包括了augmentation之后的数据(详见论文及R2CNN的README.md)。
可否将转化icdar2015以及生成merge_train.txt代码上传到github上供参考
- 我的xml格式跟tensorflow版本的是一样的,都是四个点的坐标(八个数值)。
,可以看到你给出的框是水平框(x,y,width,height),不符合R2CNN和tensorflow版本的要求。
另外,我这里有一份已经生成好的roid_data,你可以直接拿过来训练。 roid_data
另外,工作日比较忙,回复不及时,请见谅。