tensorflow-yolov3
tensorflow-yolov3 copied to clipboard
Trainning on coco2017, how much can you stop training when the loss value drops. 损失值降到多少时可以停止训练?使用COCO2017数据集
大佬,我也在训练coco2017数据集.我有个问题想请教一下.作者的代码分两阶段训练,我发现开始第二个阶段训练的时候训练集测试集loss会突然上升,然后训练集会慢慢下降,但是测试集下降了几个epoch后就开始上升了,越来越大,请问是我哪里训练有问题么?
@iodncookie 你说的这个我没有遇到,我的test loss目前稳定在27、28左右,train loss一直在降,一直在训练没有停。
我是按照作者设置的config来运行的,不知道哪里有问题.您的config文件方便发给我看看么?
@iodncookie 我用的也是作者原版config
@zhishao 方便微信交流一下么.我的微信是 pc544556
@iodncookie 总之就是感觉loss降得比较慢
@zhishao 你训练一个epoch要多久?
@iodncookie 我用mobilenetv3 batchsize=6 GPU是2070S一个epoch两个小时吧 训练了十天目前train loss 22,test loss 一直是27不变,每个epoch train loss只降0.X,太慢了,不知道是哪里出问题... 然后测试mAP只有百分之零点几...
应该是加载数据方式的原因.我之前训练也是很慢,后面改了一下加载数据的方式,能快个3倍左右吧.
我用mobilenet v2训练过,mAP也很低,只有百分之46左右.
@iodncookie 为什么会这么低呢?loss降的慢是什么原因呢?你有分析过吗?是主干网络的原因吗?原版darknet53你试过吗?多少epoch收敛?
@iodncookie 我用的也是作者原版config
你好,我想问下你们用自己的数据训练了吗,我用自己的数据训练,按照博主的步骤走的,都跑通了,在最后测试的时候,我标记的是“人”这个类别,但是在运行evaluate.py出来的ground-truth跟predicted文件,里面出来的类别是“bird"最后运行main.py出来的也还是”bird"类别的ap,不知道哪里有问题。
@iodncookie 我用的也是作者原版config
你好,我想问下你们用自己的数据训练了吗,我用自己的数据训练,按照博主的步骤走的,都跑通了,在最后测试的时候,我标记的是“人”这个类别,但是在运行evaluate.py出来的ground-truth跟predicted文件,里面出来的类别是“bird"最后运行main.py出来的也还是”bird"类别的ap,不知道哪里有问题。
你有改一下coco.names文件么
没有改呢,coconame里面我看有person这个类别就没动,要改为一类吗?------------------ 原始邮件 ------------------ 发件人: "Ponchine Tion"[email protected] 发送时间: 2019年12月18日(星期三) 上午10:31 收件人: "YunYang1994/tensorflow-yolov3"[email protected]; 抄送: "jhfollowgd"[email protected];"Comment"[email protected]; 主题: Re: [YunYang1994/tensorflow-yolov3] Trainning on coco2017, how much can you stop training when the loss value drops. 损失值降到多少时可以停止训练?使用COCO2017数据集 (#442)
@iodncookie 我用的也是作者原版config
你好,我想问下你们用自己的数据训练了吗,我用自己的数据训练,按照博主的步骤走的,都跑通了,在最后测试的时候,我标记的是“人”这个类别,但是在运行evaluate.py出来的ground-truth跟predicted文件,里面出来的类别是“bird"最后运行main.py出来的也还是”bird"类别的ap,不知道哪里有问题。
你有改一下coco.names文件么
— You are receiving this because you commented. Reply to this email directly, view it on GitHub, or unsubscribe.
没有改呢,coconame里面我看有person这个类别就没动,要改为一类吗?------------------ 原始邮件 ------------------ 发件人: "Ponchine Tion"[email protected] 发送时间: 2019年12月18日(星期三) 上午10:31 收件人: "YunYang1994/tensorflow-yolov3"[email protected]; 抄送: "jhfollowgd"[email protected];"Comment"[email protected]; 主题: Re: [YunYang1994/tensorflow-yolov3] Trainning on coco2017, how much can you stop training when the loss value drops. 损失值降到多少时可以停止训练?使用COCO2017数据集 (#442) @iodncookie 我用的也是作者原版config 你好,我想问下你们用自己的数据训练了吗,我用自己的数据训练,按照博主的步骤走的,都跑通了,在最后测试的时候,我标记的是“人”这个类别,但是在运行evaluate.py出来的ground-truth跟predicted文件,里面出来的类别是“bird"最后运行main.py出来的也还是”bird"类别的ap,不知道哪里有问题。 你有改一下coco.names文件么 — You are receiving this because you commented. Reply to this email directly, view it on GitHub, or unsubscribe.
嗯嗯,要改一下
我把coconame改为一类运行报错,然后就把80类全改为80个person运行出来了。这是不是要改其他地方的代码啊?😂😂------------------ 原始邮件 ------------------ 发件人: "Ponchine Tion"[email protected] 发送时间: 2019年12月18日(星期三) 中午11:11 收件人: "YunYang1994/tensorflow-yolov3"[email protected]; 抄送: "jhfollowgd"[email protected];"Comment"[email protected]; 主题: Re: [YunYang1994/tensorflow-yolov3] Trainning on coco2017, how much can you stop training when the loss value drops. 损失值降到多少时可以停止训练?使用COCO2017数据集 (#442)
没有改呢,coconame里面我看有person这个类别就没动,要改为一类吗?------------------ 原始邮件 ------------------ 发件人: "Ponchine Tion"[email protected] 发送时间: 2019年12月18日(星期三) 上午10:31 收件人: "YunYang1994/tensorflow-yolov3"[email protected]; 抄送: "jhfollowgd"[email protected];"Comment"[email protected]; 主题: Re: [YunYang1994/tensorflow-yolov3] Trainning on coco2017, how much can you stop training when the loss value drops. 损失值降到多少时可以停止训练?使用COCO2017数据集 (#442) @iodncookie 我用的也是作者原版config 你好,我想问下你们用自己的数据训练了吗,我用自己的数据训练,按照博主的步骤走的,都跑通了,在最后测试的时候,我标记的是“人”这个类别,但是在运行evaluate.py出来的ground-truth跟predicted文件,里面出来的类别是“bird"最后运行main.py出来的也还是”bird"类别的ap,不知道哪里有问题。 你有改一下coco.names文件么 — You are receiving this because you commented. Reply to this email directly, view it on GitHub, or unsubscribe.
嗯嗯,要改一下
— You are receiving this because you commented. Reply to this email directly, view it on GitHub, or unsubscribe.
一旦类别固定了,网络最后的输出也就固定了,所以你要改类别的话得重新训练了.训练代码不用改,只要把类别文件改了就行.
@jhfollowgd
嗯嗯,那我这样改成80个类别直接测试有问题吗?还是需要改了类别再重新训练吗?还有个问题(可能也是我没训练好吧)就是训练得到的模型,需要转为相应的pb文件然后在imagedemo里面测试吗?我虽然现在检查精度有95,但是在imagedemo里面运行,图片什么类别也检测不出来。------------------ 原始邮件 ------------------ 发件人: "Ponchine Tion"[email protected] 发送时间: 2019年12月18日(星期三) 中午11:33 收件人: "YunYang1994/tensorflow-yolov3"[email protected]; 抄送: "jhfollowgd"[email protected];"Comment"[email protected]; 主题: Re: [YunYang1994/tensorflow-yolov3] Trainning on coco2017, how much can you stop training when the loss value drops. 损失值降到多少时可以停止训练?使用COCO2017数据集 (#442)
一旦类别固定了,网络最后的输出也就固定了,所以你要改类别的话得重新训练了.训练代码不用改,只要把类别文件改了就行.
— You are receiving this because you commented. Reply to this email directly, view it on GitHub, or unsubscribe.
个人感觉还是要重新训练的,毕竟网络最后预测的输出跟类别有关,会导致训练过程有一定区别. 测试的话需要将模型转化为pb文件. @jhfollowgd
嗯嗯,非常感谢您!------------------ 原始邮件 ------------------ 发件人: "Ponchine Tion"[email protected] 发送时间: 2019年12月18日(星期三) 中午11:50 收件人: "YunYang1994/tensorflow-yolov3"[email protected]; 抄送: "jhfollowgd"[email protected];"Mention"[email protected]; 主题: Re: [YunYang1994/tensorflow-yolov3] Trainning on coco2017, how much can you stop training when the loss value drops. 损失值降到多少时可以停止训练?使用COCO2017数据集 (#442)
个人感觉还是要重新训练的,毕竟网络最后预测的输出跟类别有关,会导致训练过程有一定区别. 测试的话需要将模型转化为pb文件. @jhfollowgd
— You are receiving this because you were mentioned. Reply to this email directly, view it on GitHub, or unsubscribe.
你好,想问个问题,在运行时,batch_size作者是设置了6,你有修改这些大小吗?我修改了几次,运行完第一阶段就停止了,第二阶段运行不了。 报这个错,好像是说内存不够了。 I tensorflow/core/common_runtime/bfc_allocator.cc:645] Chunk at 0000000217715F00 of size 1024
你好,想问个问题,在运行时,batch_size作者是设置了6,你有修改这些大小吗?我修改了几次,运行完第一阶段就停止了,第二阶段运行不了。 报这个错,好像是说内存不够了。 I tensorflow/core/common_runtime/bfc_allocator.cc:645] Chunk at 0000000217715F00 of size 1024
我也遇到这样的问题,第二阶段优化全部层,所以显存溢出了,我改动batchsize让其在第二阶段可以正常运行后,重新训练了。
请问你们在COCO上训练出来了吗,我的val loss一直在二十多就下不去了,没能完全复现paper的结果不过也差不多了。mAP0.5=51左右。 用自己的数据darknet53训练的效果还不错mAP=76左右,不过换成mobilenetv2之后mAP实验了几次都只有45~50,讲道理这俩模型不应该差这么多啊。请问是和调参有关系吗。
@Shank2358 mobilenetv2的精度应该比darknet53小一些.调参帮助应该不大.
我想问下大家,你们知道日志怎么打开吗?DESKTOP-OQHVMV6这种文件怎么打开,想用日志画一个loss损失函数的迭代图!
您好,我也遇到了loss不下降的问题,基本从第二个epoch之后loss就稳定了,train_loss会稍微降一点,但是test_loss基本不降,还有就是训练完,eval的结果ap只有零点几,这怎么解决呢@zhishao@iodncookie
@zhishao @iodncookie @jhfollowgd @CNUyue @Shank2358 @jersonal 你好,想问下你们的 COCO 数据集是怎么处理然后用于训练的?是把 COCO 转换成 PASCAL VOC 的格式吗?
谢谢
是的,仓主项目里有转化文件。
发自我的iPhone
------------------ 原始邮件 ------------------ 发件人: ylqi007 <[email protected]> 发送时间: 2020年10月20日 09:19 收件人: YunYang1994/tensorflow-yolov3 <[email protected]> 抄送: Ponchine Tion <[email protected]>, Mention <[email protected]> 主题: 回复:[YunYang1994/tensorflow-yolov3] Trainning on coco2017, how much can you stop training when the loss value drops. 损失值降到多少时可以停止训练?使用COCO2017数据集 (#442)
@zhishao @iodncookie @jhfollowgd @CNUyue 你好,想问下你们的 COCO 数据集是怎么处理然后用于训练的?是把 COCO 转换成 PASCAL VOC 的格式吗?
谢谢
— You are receiving this because you were mentioned. Reply to this email directly, view it on GitHub, or unsubscribe.
@zhishao @iodncookie @jhfollowgd @CNUyue @Shank2358 @jersonal 你好,想问下你们的 COCO 数据集是怎么处理然后用于训练的?是把 COCO 转换成 PASCAL VOC 的格式吗?
谢谢
将coco数据集转换成这个项目需要的格式,该项目的readme中有写,转换代码需要自己写.