mask-rcnn-tf2
mask-rcnn-tf2 copied to clipboard
这是一个mask-rcnn-tf2的库,可以用于训练自己的模型。
请问老师,训练自己的数据集,第40个epoch时提醒Intel MKL ERROR: Parameter 6 was incorrect on entry to DGELSD. 之后的loss会变成nan 这是什么问题呢 感谢老师
第一是在训练的过程中每跑完一个epoch就会出现下面的报告: “Intel MKL ERROR: Parameter 6 was incorrect on entry to DGELSD”。 第二是模型没有保存best_epoch_weights,运行了几遍都不保存。 虽然可以顺利完成自己数据集的训练,但还是想请教这两个问题怎么解决? Tensorflow=2.5.0 cuda=11.3.1 cudnn=8.2.1 显卡是A4000 最后,感谢博主提供的代码!
你好up,我的模型训练了n天了,尝试了不同的调参方式,loss总是降不下去  不知道为什么。如果继续延长训练时间(我最长一次训练了4天),也没有改进。 请问有什么建议么~ 有看到up的问题汇总里面说,loss只是判断收敛与否的指标,数值不代表什么 但是我用eval.py跑了以后效果也奇差,所以我觉得也许还是和训练有关系? 求B导指点!!!!
Using TensorFlow backend. Traceback (most recent call last): File "", line 1, in File "C:\ProgramData\anaconda3\envs\keras_3.6\lib\multiprocessing\spawn.py", line 105, in spawn_main exitcode = _main(fd) File "C:\ProgramData\anaconda3\envs\keras_3.6\lib\multiprocessing\spawn.py", line 115, in _main self =...
Errors may have originated from an input operation. Input Source operations connected to node mask_rcnn/ROI/GatherV2_5: mask_rcnn/ROI/strided_slice_12 (defined at mask-rcnn-tf2-master\nets\layers.py:12) Function call stack: train_function : W tensorflow/core/kernels/data/generator_dataset_op.cc:107] Error occurred when finalizing...
lossnan问题?
大佬,我跑你git代码和你的数据集出现lossnan问题,Epoch 00002: LearningRateScheduler reducing learning rate to 6e-06. Epoch 2/100 202/202 [==============================] - 106s 527ms/step - loss: nan - rpn_class_loss_loss: nan - rpn_bbox_loss_loss: nan - mrcnn_class_loss_loss: 1.0970 - mrcnn_bbox_loss_loss: 0.0000e+00...
b导您好,请问一下怎么在eval.py中实现计算F1分数、recall、accuracy这些指标呀
Layer #464 (named "mrcnn_bbox_fc"), weight has shape (1024, 12), but the saved weight has shape (1024, 16). gtx3050,cuda11.1和cudnn11.1,tensorflow2.5.0,python3.7的环境运行的
大佬你好,我用你的模型来实现百香果枝条的语义分割,但是预测出来的结果只有预测框,没有把实例分割出来,这是什么情况呀 