mask-rcnn-tf2 issues

请问老师，训练自己的数据集第40epoch时报错Intel MKL ERROR: Parameter 6 was incorrect on entry to DGELSD.

4

请问老师，训练自己的数据集，第40个epoch时提醒Intel MKL ERROR: Parameter 6 was incorrect on entry to DGELSD. 之后的loss会变成nan 这是什么问题呢感谢老师

博主你好，我有两个问题想要打扰一下

1

第一是在训练的过程中每跑完一个epoch就会出现下面的报告： “Intel MKL ERROR: Parameter 6 was incorrect on entry to DGELSD”。第二是模型没有保存best_epoch_weights，运行了几遍都不保存。虽然可以顺利完成自己数据集的训练，但还是想请教这两个问题怎么解决？ Tensorflow=2.5.0 cuda=11.3.1 cudnn=8.2.1 显卡是A4000 最后，感谢博主提供的代码！

zzzxhao0852

loss 降不下去，不收敛

18

你好up，我的模型训练了n天了，尝试了不同的调参方式，loss总是降不下去 ![image](https://github.com/bubbliiiing/mask-rcnn-tf2/assets/93203426/a9558a88-ba00-4c90-94e7-a2cb44b3696a) 不知道为什么。如果继续延长训练时间（我最长一次训练了4天），也没有改进。请问有什么建议么~ 有看到up的问题汇总里面说，loss只是判断收敛与否的指标，数值不代表什么但是我用eval.py跑了以后效果也奇差，所以我觉得也许还是和训练有关系？求B导指点！！！！

xieyizi990430

AttributeError: Can't get attribute 'TrainConfig' on <module '__mp_main__' from 'D:\\my_job\\MY_Github\\mask-rcnn-keras-master\\train.py'>

2

Using TensorFlow backend. Traceback (most recent call last): File "", line 1, in File "C:\ProgramData\anaconda3\envs\keras_3.6\lib\multiprocessing\spawn.py", line 105, in spawn_main exitcode = _main(fd) File "C:\ProgramData\anaconda3\envs\keras_3.6\lib\multiprocessing\spawn.py", line 115, in _main self =...

songjiahao-wq

求问博主帮我看看跑maskrcnn时出现的错误，已知环境按照tf2.4配置在windows30显卡系列下运行出现的错误

4

Errors may have originated from an input operation. Input Source operations connected to node mask_rcnn/ROI/GatherV2_5: mask_rcnn/ROI/strided_slice_12 (defined at mask-rcnn-tf2-master\nets\layers.py:12) Function call stack: train_function : W tensorflow/core/kernels/data/generator_dataset_op.cc:107] Error occurred when finalizing...

jcy8

lossnan问题?

21

大佬，我跑你git代码和你的数据集出现lossnan问题，Epoch 00002: LearningRateScheduler reducing learning rate to 6e-06. Epoch 2/100 202/202 [==============================] - 106s 527ms/step - loss: nan - rpn_class_loss_loss: nan - rpn_bbox_loss_loss: nan - mrcnn_class_loss_loss: 1.0970 - mrcnn_bbox_loss_loss: 0.0000e+00...

ChenMaolong

B导您好，想请教一下关于eval.py里指标计算的问题

2

b导您好，请问一下怎么在eval.py中实现计算F1分数、recall、accuracy这些指标呀

qa1511

怎么用CPU预测？因为有些人电脑上没有GPU，想加个逻辑如果有Gpu就用GPU，没有就用CPU

shihenren

请问这个错误是什么原因啊

7

Layer #464 (named "mrcnn_bbox_fc"), weight has shape (1024, 12), but the saved weight has shape (1024, 16). gtx3050，cuda11.1和cudnn11.1，tensorflow2.5.0，python3.7的环境运行的

yasaorder

预测出来的图片没有mask

1

大佬你好，我用你的模型来实现百香果枝条的语义分割，但是预测出来的结果只有预测框，没有把实例分割出来，这是什么情况呀 ![test](https://user-images.githubusercontent.com/91509881/226324307-524a08ff-41ea-4255-8ea4-6e5fd3e0eff0.png)

PRedStop

mask-rcnn-tf2
mask-rcnn-tf2 copied to clipboard

Metadata

请问老师，训练自己的数据集第40epoch时报错Intel MKL ERROR: Parameter 6 was incorrect on entry to DGELSD.

博主你好，我有两个问题想要打扰一下

loss 降不下去，不收敛

AttributeError: Can't get attribute 'TrainConfig' on <module '__mp_main__' from 'D:\\my_job\\MY_Github\\mask-rcnn-keras-master\\train.py'>

求问博主帮我看看跑maskrcnn时出现的错误，已知环境按照tf2.4配置在windows30显卡系列下运行出现的错误

lossnan问题?

B导您好，想请教一下关于eval.py里指标计算的问题

怎么用CPU预测？因为有些人电脑上没有GPU，想加个逻辑如果有Gpu就用GPU，没有就用CPU

请问这个错误是什么原因啊

预测出来的图片没有mask

← Metadata

Owner

Metadata

mask-rcnn-tf2 mask-rcnn-tf2 copied to clipboard

Metadata

← Metadata

Owner

Metadata

mask-rcnn-tf2
mask-rcnn-tf2 copied to clipboard