R2CNN icon indicating copy to clipboard operation
R2CNN copied to clipboard

用R2CNN训练自己的数据集遇到了问题

Open gittigxuy opened this issue 6 years ago • 7 comments

icdar.py当中看到了两个txt文件,在py-faster rcnn当中会在ImageSets/Main生成trainval.txt,这个trainval.txt对应图片当中的哪个文件呢?merge_train.txt里面的内容是什么呢?

default

gittigxuy avatar Apr 15 '18 05:04 gittigxuy

自认为py-faster rcnn当中会在ImageSets/Main生成trainval.txt和merge_train.txt是同一个文件,在icdar.py当中解析xml文件的时候,我自己生成的xml文件和作者你解析xml文件的_load_icdar_annotaion函数结构不太一样,可否将icdar 2015的生成xml文件的代码发送到[email protected],谢谢作者了

gittigxuy avatar Apr 15 '18 05:04 gittigxuy

附上我生成的xml文件的截图 default

gittigxuy avatar Apr 15 '18 05:04 gittigxuy

default

default

请问一下为什么cross point不存在

gittigxuy avatar Apr 15 '18 06:04 gittigxuy

@gittigxuy 不论是py-faster-rcnn还是R2CNN,dataset下面的pascal_voc.py(或icdar.py)目的都是一样的,都是找到xml文件,R2CNN之所以用merge_train.txt是因为R2CNN的原始paper中有一个data augmentation的操作,所以merge_train.txt不仅包括了原始的icdar2015+icdar2013的数据,还包括了augmentation之后的数据(详见论文及R2CNN的README.md)。

beacandler avatar Apr 15 '18 13:04 beacandler

可否将转化icdar2015以及生成merge_train.txt代码上传到github上供参考

gittigxuy avatar Apr 15 '18 15:04 gittigxuy

  1. 我的xml格式跟tensorflow版本的是一样的,都是四个点的坐标(八个数值)。

,可以看到你给出的框是水平框(x,y,width,height),不符合R2CNN和tensorflow版本的要求。

另外,我这里有一份已经生成好的roid_data,你可以直接拿过来训练。 roid_data

另外,工作日比较忙,回复不及时,请见谅。

beacandler avatar Apr 21 '18 09:04 beacandler