PaddleSeg icon indicating copy to clipboard operation
PaddleSeg copied to clipboard

数据集PPM-100进行matting训练问题

Open yangy996 opened this issue 3 years ago • 19 comments

加载预训练模型modnet-hrnet_w18.pdparams 训练过程中会出现结果为nan的情况 image

而且SAD和MSE训练的结果非常高,与预训练模型评估的结果相差甚远 [EVAL] SAD: 3141.6386, MSE: 0.2802

yangy996 avatar Nov 11 '21 08:11 yangy996

https://github.com/PaddlePaddle/PaddleSeg/blob/release/2.3/contrib/Matting/model/modnet.py#L88 可能是这边分母出现了0的情况,在分母加一下1e-6试试,如果解决了,欢迎提个pr哈

wuyefeilin avatar Nov 11 '21 09:11 wuyefeilin

https://github.com/PaddlePaddle/PaddleSeg/blob/release/2.3/contrib/Matting/model/modnet.py#L88 可能是这边分母出现了0的情况,在分母加一下1e-6试试,如果解决了,欢迎提个pr哈

暂时不报nan了,还在训练中,到时候看看结果是否跟文档中一样

但是不明白为啥分母会变0,看数据处理是填充了128值,loss计算的时候为什么取到的值会为0 image image

yangy996 avatar Nov 11 '21 10:11 yangy996

可能是在数据增强时进行crop的时候导致的, 如果是该问题导致的,欢迎提个pr哈

wuyefeilin avatar Nov 11 '21 12:11 wuyefeilin

可能是在数据增强时进行crop的时候导致的, 如果是该问题导致的,欢迎提个pr哈

好像不太对,训练了一晚上,SAD和MSE值非常大,跟文档差别太大了 image image

yangy996 avatar Nov 12 '21 00:11 yangy996

提供的只是教程,让你跑通用的。如果要训练自己的模型你需要自己准备数据集,以我们的模型作为预训练模型进行微调

wuyefeilin avatar Nov 12 '21 02:11 wuyefeilin

额,数据集PPM-100文档中的结果不是通过提供的代码和教程训练出来的?

yangy996 avatar Nov 12 '21 02:11 yangy996

内部数据训练的,不能开源哈

wuyefeilin avatar Nov 12 '21 02:11 wuyefeilin

哦哦,好的,看文档还以为只用PPM-100数据集训练得了 )M14SEALAJW$TP)X%O~E)~P

yangy996 avatar Nov 12 '21 02:11 yangy996

提供的只是教程,让你跑通用的。如果要训练自己的模型你需要自己准备数据集,以我们的模型作为预训练模型进行微调

大佬,还有个问题,我用提供的预训练模型对PPM-100数据集进行训练,为什么结果相差巨大呢?训练效果显示加不加载预训练模型结果都一样

yangy996 avatar Nov 12 '21 06:11 yangy996

PPM-100只是一个公开的benchmark哦, 网上有一些公开的数据集Composition-1k, Distinctions-646, VideMatte240k, 等等,你可以在这些数据集上进行训练哈

wuyefeilin avatar Nov 12 '21 09:11 wuyefeilin

大佬,问下你们训练的数据集样本量大概有多少,MSE才能到0.00几

miyane-ralo avatar Nov 19 '21 05:11 miyane-ralo

还有一个问题,大佬readme里的效果图是加了trimap吗?

miyane-ralo avatar Nov 19 '21 05:11 miyane-ralo

没有的,就是用modnet训练的结果

wuyefeilin avatar Nov 22 '21 03:11 wuyefeilin

那大佬的训练数据集样本大概用了多少,MSE才能到0.00几,达到咱们发布的效果呀

Sun-2020 avatar Nov 22 '21 03:11 Sun-2020

那大佬的训练数据集样本大概用了多少,MSE才能到0.00几,达到咱们发布的效果呀

还在收集数据集训练中

yangy996 avatar Nov 22 '21 03:11 yangy996

这边找到了有两份数据集 https://github.com/kelisiya/TIMI-Net DHYAI_@E}8$_AYL5WY0TMM8

https://github.com/YY007H/P3M 4YM (9%2S5LHOEO{HRKLROD

yangy996 avatar Nov 22 '21 03:11 yangy996

内部数据训练的,不能开源哈

您好,我想问一下训练的epoch如何设置,我做好数据,只跑了一个晚上就自己停止了,我想知道在那里设置epoch呢,期待您的回复

zhanghongyong123456 avatar Dec 22 '21 01:12 zhanghongyong123456

可以通过参数--iters设置训练的步数, 或者修改config目录下相关的参数

wuyefeilin avatar Dec 28 '21 02:12 wuyefeilin

GPU 还有这个情况 loss=nan ,cpu就正常 用的是 :PaddleSeg: 2.6.0

gg22mm avatar Jul 22 '22 01:07 gg22mm

This issue has been automatically marked as stale because it has not had recent activity. It will be closed in 7 days if no further activity occurs. Thank you for your contributions.

github-actions[bot] avatar Dec 07 '22 17:12 github-actions[bot]