Jamjamjon
Jamjamjon
cool! Thanks! @xenova
> > > 官方似乎没有segment的example > > > > > > 已经放弃candle转ort了,同样的yolov8,cpu,fp32,onnxruntime跑一张图片只要40ms,candle需要300ms(且都是不计前/后处理时间) > > 我试了[usls](https://github.com/jamjamjon/usls/tree/main/examples/yolov8),det很快,seg也很慢 我是[usls](https://github.com/jamjamjon/usls/tree/main/examples/yolov8)作者,目前yolov8的segment后处理使用了image crate,他的resize比较耗时,此外,在YOLO struct的实现中,为了整合所有的YOLOv8任务,后处理代码有点冗余,后面有时间我会优化resize速度问题。
@lujing-jlu @Lixuhuilll `usls`更新了yolo后处理,检测任务只需要1ms左右;分割任务测试官方bus.jpg,640*640分辨率,在我机器上之前要120ms,现在只需要20ms左右,主要时间占用和分割目标数量强相关。每个目标物从p3尺度resize到640大约需要900us,bus.jpg中含有六个目标物。此外还有find_contours也是占时间的大户,大约1.3ms一个mask。如果你们有更好地提升策略,欢迎交流!求star⭐️