tensorflow-yolov3 icon indicating copy to clipboard operation
tensorflow-yolov3 copied to clipboard

如何继续训练

Open weilanShi opened this issue 5 years ago • 16 comments

你好,作者,非常感谢提供tf的yolo,项目很好,但我还是有一个问题:请问如何在训练了一段时间中断了后继续加载之前的模型继续训练呢,目前跑完了设置的epoch,但loss还是比较大,所以想继续接着之前的训练,望回复! 万分感谢!

weilanShi avatar Aug 19 '19 01:08 weilanShi

可以试试把core目录下的cfg文件里 的初始权重改一下 C.YOLO.ORIGINAL_WEIGHT = "./checkpoint/yolov3_coco.ckpt" 这句等号后面改成你目前生成的ckpt文件。 也许可以我也没试过。。 我跑了9个epoch ,loss在8左右,之后就很难训练了,loss几乎不降了。test了一下准确率很高了

liutianxin0722 avatar Aug 19 '19 02:08 liutianxin0722

可以试试把core目录下的cfg文件里 的初始权重改一下 C.YOLO.ORIGINAL_WEIGHT = "./checkpoint/yolov3_coco.ckpt" 这句等号后面改成你目前生成的ckpt文件。 也许可以我也没试过。。 我跑了9个epoch ,loss在8左右,之后就很难训练了,loss几乎不降了。test了一下准确率很高了

你好。我想问下如果测试的话,需要将自己训练的权重转为pb文件吗,我自己训练好数据,然后把权重转为pb文件,但是在demo中测试总是会报错,你有转pb文件测试吗?

jhfollowgd avatar Aug 19 '19 12:08 jhfollowgd

可以试试把core目录下的cfg文件里 的初始权重改一下 C.YOLO.ORIGINAL_WEIGHT = "./checkpoint/yolov3_coco.ckpt" 这句等号后面改成你目前生成的ckpt文件。 也许可以试过。。 我跑了9个epoch ,loss在8左右,之后就很难训练了,loss几乎不降了。test了一下准确率很高了

你好,想请问下,你这个loss是8左右,是分了几类,数据有多少啊?我分3类,loss在40一直降不下来,不过类别之间数据有点不均等。

jhfollowgd avatar Aug 19 '19 13:08 jhfollowgd

可以试试把core目录下的cfg文件里 的初始权重改一下 C.YOLO.ORIGINAL_WEIGHT = "./checkpoint/yolov3_coco.ckpt" 这句等号后面改成你目前生成的ckpt文件。 也许可以我也没试过。。 我跑了9个epoch ,loss在8左右,之后就很难训练了,loss几乎不降了。test了一下准确率很高了 训练loss在8左右吗?我也是,跑了几百个epoch的,了loss还是很高,还没测试,不知道效果怎么样

weilanShi avatar Aug 20 '19 03:08 weilanShi

可以试试把core目录下的cfg文件里 的初始权重改一下 C.YOLO.ORIGINAL_WEIGHT = "./checkpoint/yolov3_coco.ckpt" 这句等号后面改成你目前生成的ckpt文件。 也许可以试过。。 我跑了9个epoch ,loss在8左右,之后就很难训练了,loss几乎不降了。test了一下准确率很高了

你好,想请问下,你这个loss是8左右,是分了几类,数据有多少啊?我分3类,loss在40一直降不下来,不过类别之间数据有点不均等。

我这个就是跑了一下仓主的train,没有用自己的数据,而且初始权重是coco那个,所以loss很快就低了。 我不太清楚你说的分类是什么,是用了自己的训练数据吗?
那个pb文件,如果跑demo的话是需要的,只跑evaluate不需要吧

liutianxin0722 avatar Aug 20 '19 09:08 liutianxin0722

@liutianxin0722 你好,请问你train的时候用的coco 训练集还是VOC?我训练voc的时候因为coco 和 voc分类数目不同所以加载coco权重失败了。。。

lddsjy avatar Aug 22 '19 09:08 lddsjy

@liutianxin0722 你好,请问你train的时候用的coco 训练集还是VOC?我训练voc的时候因为coco 和 voc分类数目不同所以加载coco权重失败了。。。

我训练数据是VOC,仓主那个目录示意图有点问题,2007和2012的train是并列在一个文件夹里。我加载权重没出现问题啊。。

liutianxin0722 avatar Aug 22 '19 09:08 liutianxin0722

@liutianxin0722 你好,请问你train的时候用的coco 训练集还是VOC?我训练voc的时候因为coco 和 voc分类数目不同所以加载coco权重失败了。。。

我训练数据是VOC,仓主那个目录示意图有点问题,2007和2012的train是并列在一个文件夹里。我加载权重没出现问题啊。。

请问你config.py里面的设置有改么?

__C.YOLO.CLASSES = "./data/classes/coco.names" 我改成voc.names就不行

lddsjy avatar Aug 22 '19 11:08 lddsjy

@lddsjy 我都按readme里面的提示改了,你该不会下载的voc数据有问题吧。。

liutianxin0722 avatar Aug 22 '19 15:08 liutianxin0722

@lddsjy python scripts/voc_annotation.py --data_path /home/yang/test/VOC这句没漏看吧,yang这些改成自己目录地址

liutianxin0722 avatar Aug 22 '19 16:08 liutianxin0722

你报错显示的是什么?我又试了一下还是没报错啊 convertweight和train都正常跑

https://maas.mail.163.com/dashi-web-extend/html/proSignature.html?ftlId=1&name=tliuao&uid=tliuao%40connect.ust.hk&iconUrl=https%3A%2F%2Fmail-online.nosdn.127.net%2Fqiyelogo%2FdefaultAvatar.png&items=%5B%22%E9%82%AE%E7%AE%B1%EF%BC%9Atliuao%40connect.ust.hk%22%5D [https://mail-online.nosdn.127.net/qiyelogo/defaultAvatar.png] tliuao 邮箱:[email protected]

签名由 网易邮箱大师https://mail.163.com/dashi/dlpro.html?from=mail88 定制

在2019年08月23日 05:41,lddsjymailto:[email protected] 写道:

@liutianxin0722https://github.com/liutianxin0722 不会,图片地址不对会报别的错。我把voc.names 改成八十种就能正常运行。不然convert_weight那里就会因为种类数对不上导致shape不匹配然后报错。你的voc.names是二十种还是八十种?要是20还没报错的话,震惊。。

— You are receiving this because you were mentioned. Reply to this email directly, view it on GitHubhttps://github.com/YunYang1994/tensorflow-yolov3/issues/290?email_source=notifications&email_token=AMXTAU7GXMHIP2LMD24HVWTQF32X5A5CNFSM4IMVB7X2YY3PNVWWK3TUL52HS4DFVREXG43VMVBW63LNMVXHJKTDN5WW2ZLOORPWSZGOD46KRLY#issuecomment-524069039, or mute the threadhttps://github.com/notifications/unsubscribe-auth/AMXTAU2CFT6IBX5DIV7YNITQF32X5ANCNFSM4IMVB7XQ.

liutianxin0722 avatar Aug 23 '19 01:08 liutianxin0722

我检讨,我犯了个傻瓜错误,现在好啦。谢谢你~------------------ 原始邮件 ------------------ 发件人: "liutianxin0722"[email protected] 发送时间: 2019年8月23日(星期五) 上午9:13 收件人: "YunYang1994/tensorflow-yolov3"[email protected]; 抄送: "lddsjy"[email protected];"Mention"[email protected]; 主题: Re: [YunYang1994/tensorflow-yolov3] 如何继续训练 (#290)

你报错显示的是什么?我又试了一下还是没报错啊 convertweight和train都正常跑

https://maas.mail.163.com/dashi-web-extend/html/proSignature.html?ftlId=1&name=tliuao&uid=tliuao%40connect.ust.hk&iconUrl=https%3A%2F%2Fmail-online.nosdn.127.net%2Fqiyelogo%2FdefaultAvatar.png&items=%5B%22%E9%82%AE%E7%AE%B1%EF%BC%9Atliuao%40connect.ust.hk%22%5D [https://mail-online.nosdn.127.net/qiyelogo/defaultAvatar.png] tliuao 邮箱:[email protected]

签名由 网易邮箱大师https://mail.163.com/dashi/dlpro.html?from=mail88 定制

在2019年08月23日 05:41,lddsjymailto:[email protected] 写道:

@liutianxin0722https://github.com/liutianxin0722 不会,图片地址不对会报别的错。我把voc.names 改成八十种就能正常运行。不然convert_weight那里就会因为种类数对不上导致shape不匹配然后报错。你的voc.names是二十种还是八十种?要是20还没报错的话,震惊。。

— You are receiving this because you were mentioned. Reply to this email directly, view it on GitHubhttps://github.com/YunYang1994/tensorflow-yolov3/issues/290?email_source=notifications&email_token=AMXTAU7GXMHIP2LMD24HVWTQF32X5A5CNFSM4IMVB7X2YY3PNVWWK3TUL52HS4DFVREXG43VMVBW63LNMVXHJKTDN5WW2ZLOORPWSZGOD46KRLY#issuecomment-524069039, or mute the threadhttps://github.com/notifications/unsubscribe-auth/AMXTAU2CFT6IBX5DIV7YNITQF32X5ANCNFSM4IMVB7XQ.

— You are receiving this because you were mentioned. Reply to this email directly, view it on GitHub, or mute the thread.

lddsjy avatar Aug 23 '19 08:08 lddsjy

可以试试把core目录下的cfg文件里 的初始权重改一下 C.YOLO.ORIGINAL_WEIGHT = "./checkpoint/yolov3_coco.ckpt" 这句等号后面改成你目前生成的ckpt文件。 也许可以我也没试过。。 我跑了9个epoch ,loss在8左右,之后就很难训练了,loss几乎不降了。test了一下准确率很高了 训练loss在8左右吗?我也是,跑了几百个epoch的,了loss还是很高,还没测试,不知道效果怎么样

在core里面改了,将初始权重改成自己训练的了,然后转为了pb文件,去测试的时候就会报shape不匹配的错误。

jhfollowgd avatar Aug 23 '19 12:08 jhfollowgd

你报错显示的是什么?我又试了一下还是没报错啊 convertweight和train都正常跑 https://maas.mail.163.com/dashi-web-extend/html/proSignature.html?ftlId=1&name=tliuao&uid=tliuao%40connect.ust.hk&iconUrl=https%3A%2F%2Fmail-online.nosdn.127.net%2Fqiyelogo%2FdefaultAvatar.png&items=%5B%22%E9%82%AE%E7%AE%B1%EF%BC%9Atliuao%40connect.ust.hk%22%5D [https://mail-online.nosdn.127.net/qiyelogo/defaultAvatar.png] tliuao 邮箱:[email protected] 签名由 网易邮箱大师https://mail.163.com/dashi/dlpro.html?from=mail88 定制 在2019年08月23日 05:41,lddsjymailto:[email protected] 写道: @liutianxin0722https://github.com/liutianxin0722 不会,图片地址不对会报别的错。我把voc.names 改成八十种就能正常运行。不然convert_weight那里就会因为种类数对不上导致shape不匹配然后报错。你的voc.names是二十种还是八十种?要是20还没报错的话,震惊。。 — You are receiving this because you were mentioned. Reply to this email directly, view it on GitHub<#290?email_source=notifications&email_token=AMXTAU7GXMHIP2LMD24HVWTQF32X5A5CNFSM4IMVB7X2YY3PNVWWK3TUL52HS4DFVREXG43VMVBW63LNMVXHJKTDN5WW2ZLOORPWSZGOD46KRLY#issuecomment-524069039>, or mute the threadhttps://github.com/notifications/unsubscribe-auth/AMXTAU2CFT6IBX5DIV7YNITQF32X5ANCNFSM4IMVB7XQ.

你好,我想请问下,你有训练自己的数据吗,训练的模型需要像这里这样将coco的权重转为pb文件吗?

jhfollowgd avatar Aug 23 '19 12:08 jhfollowgd

@liutianxin0722 你好,请问你train的时候用的coco 训练集还是VOC?我训练voc的时候因为coco 和 voc分类数目不同所以加载coco权重失败了。。。

我训练数据是VOC,仓主那个目录示意图有点问题,2007和2012的train是并列在一个文件夹里。我加载权重没出现问题啊。。 请问你有复现仓主readme中的map值吗,我按照readme用VOC数据集按照他推荐的从coco weights继续训练,最终map是82左右

is-dc avatar Mar 01 '21 07:03 is-dc

加载Coco数据的话好像是要在config还是哪的修改一下参数,20变80 。map复现过但太久了 具体数值忘了。 tliuao 邮箱:[email protected] 签名由 网易邮箱大师 定制 在2021年03月01日 15:54,dwx5325834 写道: @liutianxin0722 你好,请问你train的时候用的coco 训练集还是VOC?我训练voc的时候因为coco 和 voc分类数目不同所以加载coco权重失败了。。。 我训练数据是VOC,仓主那个目录示意图有点问题,2007和2012的train是并列在一个文件夹里。我加载权重没出现问题啊。。 请问你有复现仓主readme中的map值吗,我按照readme用VOC数据集按照他推荐的从coco weights继续训练,最终map是82左右 — You are receiving this because you were mentioned. Reply to this email directly, view it on GitHub, or unsubscribe.

liutianxin0722 avatar Mar 02 '21 14:03 liutianxin0722