mindyolo icon indicating copy to clipboard operation
mindyolo copied to clipboard

坐标不准确

Open GXKIM opened this issue 10 months ago • 7 comments

训练完测试的时候发现坐标左上角的坐标是正确的,右下角的坐标一直都是不正确,类别也是正确的, 使用的脚本demo/predict {'category_id': [1, 1] 'bbox': [[2357.288, 3125.01, 411.551, 229.02], [2672.272, 1577.191, 352.019, 162.905], 还有一个想咨询的是,增加了一个--conf_thres 0.70 参数推理时,但score低的还是会一样的输出,并没有过滤掉 'score': [0.92802, 0.76086, 0.14375, 0.03747]

GXKIM avatar Feb 10 '25 05:02 GXKIM

@GXKIM 您好,感谢您的反馈。 请提供一下mindspore版本、mindyolo分支版本信息。以及所使用的的模型算法。

WongGawa avatar Feb 10 '25 06:02 WongGawa

@GXKIM 您好,感谢您的反馈。 请提供一下mindspore版本、mindyolo分支版本信息。以及所使用的的模型算法。

mindspore 2.4.1 mindyolo 0.3.0 yolo v10 yolov10x_500e_mAP537-aaaa57bb.ckpt

GXKIM avatar Feb 10 '25 06:02 GXKIM

建议使用readme配套的版本。可以参考https://github.com/mindspore-lab/mindyolo/pull/424 验证是否能解决你的问题。 @

WongGawa avatar Feb 12 '25 03:02 WongGawa

还是不对的 真实的坐标 [1071.48876953125,1468.3426513671875,1328.7930908203125,1621.630126953125] [1741.990966796875,1526.464111328125,1891.8211669921875,1688.5267333984375] [1617.1199951171875,649.5117797851562,1792.8013916015625,751.1517333984375] [1920.6295166015625,764.132568359375,2280.810302734375,932.0025024414062]

mindyolo预测的坐标 'bbox': [[1635.889, 636.556, 145.201, 112.173], [1078.51, 1445.023, 255.454, 185.865], [1910.938, 753.663, 462.843, 175.679], [1760.296, 1536.604, 106.245, 135.394]]

左下角的坐标是正确的,差距可以忽略不计,但右下角坐标全部不正确,测试的几个图片都是如此

GXKIM avatar Feb 12 '25 05:02 GXKIM

mindyolo预测的坐标是xywh格式的,xy是左上角坐标,wh是框的宽度和高度,根据你提供的数据,右下角的坐标也是正确的,可视化的结果应该也不会有问题

yuedongli1 avatar Feb 12 '25 06:02 yuedongli1

mindyolo预测的坐标是xywh格式的,xy是左上角坐标,wh是框的宽度和高度,根据你提供的数据,右下角的坐标也是正确的,可视化的结果应该也不会有问题

感谢答复,想请问,增加一个--conf_thres参数但,并未过滤掉一些分数较低的

GXKIM avatar Feb 12 '25 06:02 GXKIM

mindyolo预测的坐标是xywh格式的,xy是左上角坐标,wh是框的宽度和高度,根据你提供的数据,右下角的坐标也是正确的,可视化的结果应该也不会有问题

请问,mindyolo支持这种调用方式吗?有文档吗 #from ultralytics import YOLO

Load a model

model = YOLO("yolo11n.pt") # pretrained YOLO11n model

Run batched inference on a list of images

results = model(["image1.jpg", "image2.jpg"]) # return a list of Results objects

Process results list

for result in results: boxes = result.boxes # Boxes object for bounding box outputs masks = result.masks # Masks object for segmentation masks outputs keypoints = result.keypoints # Keypoints object for pose outputs probs = result.probs # Probs object for classification outputs obb = result.obb # Oriented boxes object for OBB outputs result.show() # display to screen result.save(filename="result.jpg") # save to disk

GXKIM avatar Feb 13 '25 07:02 GXKIM