Image-Adaptive-YOLO icon indicating copy to clipboard operation
Image-Adaptive-YOLO copied to clipboard

训练问题

Open pumpkin29 opened this issue 3 years ago • 26 comments

您好,我是用tensorflow=1.14,python=3.6进行训练的,能训练起来,但是报了很多警告(比如说某个函数过时了),并且train loss从第9个epoch开始就变成nan了,请问这可能是什么原因呢? 1 2 3 Inked4_LI 5

pumpkin29 avatar Jan 02 '22 05:01 pumpkin29

您好,我是用tensorflow=1.14,python=3.6进行训练的,能训练起来,但是报了很多警告(比如说某个函数过时了),并且train loss从第9个epoch开始就变成nan了,请问这可能是什么原因呢? 1 2 3 Inked4_LI 5

能问一下你怎么训练起来自己的数据集吗,我遇到一些问题,谢谢

xkai957 avatar Mar 18 '22 14:03 xkai957

您好,我是用tensorflow=1.14,python=3.6进行训练的,能训练起来,但是报了很多警告(比如说某个函数过时了),并且train loss从第9个epoch开始就变成nan了,请问这可能是什么原因呢? 1 2 3 Inked4_LI 5

能问一下你怎么训练起来自己的数据集吗,我遇到一些问题,谢谢 就是按照readme里说的,先运行data_make.py生成数据集,然后根据自己所存放的文件位置来修改config.py里的参数

pumpkin29 avatar Mar 22 '22 05:03 pumpkin29

您好,我是用tensorflow=1.14,python=3.6进行训练的,能训练起来,但是报了很多警告(比如说某个函数过时了),并且train loss从第9个epoch开始就变成nan了,请问这可能是什么原因呢? 1 2 3 Inked4_LI 5

请问你这个问题解决了吗?

XuKer avatar Mar 30 '22 01:03 XuKer

您好,我是用tensorflow=1.14,python=3.6进行训练的,能训练起来,但是报了很多警告(比如说某个函数过时了),并且train loss从第9个epoch开始就变成nan了,请问这可能是什么原因呢? 1 2 3 Inked4_LI 5

请问你这个问题解决了吗?

重新训练就好了

pumpkin29 avatar Mar 30 '22 02:03 pumpkin29

您好,我是用tensorflow=1.14,python=3.6进行训练的,能训练起来,但是报了很多警告(比如说某个函数过时了),并且train loss从第9个epoch开始就变成nan了,请问这可能是什么原因呢? 1 2 3 Inked4_LI 5

请问你这个问题解决了吗?

重新训练就好了

你训练完一个epoch需要多长时间

XuKer avatar Mar 30 '22 07:03 XuKer

您好,我是用tensorflow=1.14,python=3.6进行训练的,能训练起来,但是报了很多警告(比如说某个函数过时了),并且train loss从第9个epoch开始就变成nan了,请问这可能是什么原因呢? 1 2 3 Inked4_LI 5

请问你这个问题解决了吗?

重新训练就好了 1648626685(1) 我这个训练起来特别的慢,你知道是什么情况吗

XuKer avatar Mar 30 '22 07:03 XuKer

您好,我是用tensorflow=1.14,python=3.6进行训练的,能训练起来,但是报了很多警告(比如说某个函数过时了),并且train loss从第9个epoch开始就变成nan了,请问这可能是什么原因呢? 1 2 3 Inked4_LI 5

请问你这个问题解决了吗?

重新训练就好了 1648626685(1) 我这个训练起来特别的慢,你知道是什么情况吗

可能跟gpu配置和数据集有关

pumpkin29 avatar Mar 30 '22 08:03 pumpkin29

这个的配置代码你改过哪里没有,我就按代码中的配置训练的。数据集我也是按脚本生成的80000+

XuKer avatar Mar 30 '22 09:03 XuKer

请问你numpy用的什么版本,我使用requirements所要求的1.15.1会报错 image

isJunCheng avatar Apr 12 '22 08:04 isJunCheng

请问你numpy用的什么版本,我使用requirements所要求的1.15.1会报错 image

我用的是numpy 1.19.5

XuKer avatar Apr 14 '22 00:04 XuKer

请问你numpy用的什么版本,我使用requirements所要求的1.15.1会报错 image

我用的是numpy 1.19.5

好的,谢谢

isJunCheng avatar Apr 14 '22 03:04 isJunCheng

请问可以多卡训练吗?我尝试了一下,好像只能单卡训练?

Wuqiman avatar Apr 14 '22 03:04 Wuqiman

你好请问一下,在雾天情况下,离线生成val图像如何生成,作者没有提供voc_norm_val.txt文件。

yummy0109 avatar Jun 13 '22 08:06 yummy0109

请问你numpy用的什么版本,我使用requirements所要求的1.15.1会报错 image

我用的是numpy 1.19.5

你好请问一下,在雾天情况下,离线生成val图像如何生成,作者没有提供voc_norm_val.txt文件。

yummy0109 avatar Jun 13 '22 08:06 yummy0109

你好,请问你这个问题解决了吗,我训练特别慢,gpu占用为0,应该是用cpu训练了

yummy0109 avatar Jun 14 '22 09:06 yummy0109

你好请问一下,在雾天情况下,离线生成val图像如何生成,作者没有提供voc_norm_val.txt文件。 用data_make.py生成

pumpkin29 avatar Jun 15 '22 07:06 pumpkin29

你好,请问你这个问题解决了吗,我训练特别慢,gpu占用为0,应该是用cpu训练了

我当时是重新训练就行了

pumpkin29 avatar Jun 15 '22 08:06 pumpkin29

你好,请问你这个问题解决了吗,我训练特别慢,gpu占用为0,应该是用cpu训练了

我当时是重新训练就行了

谢谢,我忘记指定GPU号了

yummy0109 avatar Jun 16 '22 01:06 yummy0109

你好,请问你这个问题解决了吗,我训练特别慢,gpu占用为0,应该是用cpu训练了

我当时是重新训练就行了

谢谢

yummy0109 avatar Jun 16 '22 01:06 yummy0109

您好,我是用tensorflow=1.14,python=3.6进行训练的,能训练起来,但是报了很多警告(比如说某个函数过时了),并且train loss从第9个epoch开始就变成nan了,请问这可能是什么原因呢? 1 2 3 Inked4_LI 5

您好,我是用tensorflow=1.14,python=3.6进行训练的,能训练起来,但是报了很多警告(比如说某个函数过时了),并且train loss从第9个epoch开始就变成nan了,请问这可能是什么原因呢? 1 2 3 Inked4_LI 5

你好,请问一下,您自己训练的模型与作者给出的模型mAP差别大吗

yummy0109 avatar Jun 23 '22 10:06 yummy0109

您好,我是用tensorflow=1.14,python=3.6进行训练的,能训练起来,但是报了很多警告(比如说某个函数过时了),并且train loss从第9个epoch开始就变成nan了,请问这可能是什么原因呢? 1 2 3 Inked4_LI 5

您好,我是用tensorflow=1.14,python=3.6进行训练的,能训练起来,但是报了很多警告(比如说某个函数过时了),并且train loss从第9个epoch开始就变成nan了,请问这可能是什么原因呢? 1 2 3 Inked4_LI 5

你好,请问一下,您自己训练的模型与作者给出的模型mAP差别大吗 我是用自己的数据集训练的,效果还是不错的

pumpkin29 avatar Jun 24 '22 07:06 pumpkin29

你好,请问训练完evaluate的时候,需要修改什么文件路径吗,我直接运行evaluate,还是之前的三张图片,所以想请教一下需要在哪里修改路径问题

123ERFW avatar Oct 31 '22 03:10 123ERFW

我的train.py没办法训练,可以问一下,是不是需要改动什么地方呢?

zhuimengze avatar May 23 '23 09:05 zhuimengze

您好,我是用tensorflow=1.14,python=3.6进行训练的,能训练起来,但是报了很多警告(比如说某个函数过时了),并且train loss从第9个epoch开始就变成nan了,请问这可能是什么原因呢? 1 2 3 Inked4_LI 5

您好,我是用tensorflow=1.14,python=3.6进行训练的,能训练起来,但是报了很多警告(比如说某个函数过时了),并且train loss从第9个epoch开始就变成nan了,请问这可能是什么原因呢? 1 2 3 Inked4_LI 5

你好,请问一下,您自己训练的模型与作者给出的模型mAP差别大吗 我是用自己的数据集训练的,效果还是不错的

您好,请教一下关于训练模型的问题,可以与您取得联系吗?

benyufly avatar Jul 09 '23 07:07 benyufly