PaddleClas icon indicating copy to clipboard operation
PaddleClas copied to clipboard

可以提供一下生成train.txt的代码或者脚本吗

Open jingmingtao opened this issue 1 year ago • 3 comments

使用HGNET训练分类网络,制作数据集,可以分享一下制作train.txt、test.txt的代码吗,万分感谢

jingmingtao avatar Mar 21 '23 02:03 jingmingtao

目前尚未提供对应的代码和模块,但是您的建议很重要,后续我们会考虑添加

zengshao0622 avatar Mar 22 '23 02:03 zengshao0622

PaddleClas不会搞的 只会让用户自己想办法

monkeycc avatar May 01 '24 02:05 monkeycc

可以尝试使用以下代码,但需要根据你的实际使用需求进行修改相关参数

import os

#生成train.txt、val.txt
xml_dir  = ''
img_dir = ''
path_list = list()
for img in os.listdir(img_dir):
    img_path = os.path.join(img_dir,img)
    xml_path = os.path.join(xml_dir,img.replace('jpg', 'xml'))
    path_list.append((img_path, xml_path))

train_f = open('train.txt','w') 
val_f = open('val.txt','w') 

for i ,content in enumerate(path_list):
    img, xml = content
    text = img + ' ' + xml + '\n'
    if i % 5 == 0:
        val_f.write(text)
    else:
        train_f.write(text)
train_f.close()
val_f.close()

这个代码是针对目标检测中的VOC格式数据集进行train、val文件生成。

YELLOWZAN avatar May 03 '24 03:05 YELLOWZAN