Miles Zhang

Results 13 comments of Miles Zhang

我不太確定pytorch是怎麼計算FLOPs,不過MobileNetv2在輸入為224x224時大概是300 MFLOP,詳細數據可以參見GhostNet的論文,所以在輸入為32x32時MobileNetv2肯定要遠小於這個數字

第一個問題其實是FLOPs跟FPS並非正相關,FPS受到實現方法、環境等具體實作方法的影響,FLOPs則是模型理論上的每秒浮點數運算次數,這個數字比較利於學術上的比較,另外就是我是純粹的TF實現與YOLOv4用C+CUDA的實現方式在GPU的速度上會差很多,如果你在純CPU環境下運行就會發現不一樣的結果,簡而言之,如果要更快的工業應用上的速度,現在這個實現方法是不夠的。需要有進一步高效的實作方法。 第二個問題需要你提供更多訊息,尤其是json檔案的格式,包括bbox的表示方式?還有是否有採用預設的學習率下降策略?

你的bbox前兩位數是bbox的左上xy還是中心點xy?我採用的是左上xy,這點需要注意,其他應沒問題。 你可以試試看將csl_yolo.py的中的388行的focal loss註解掉,換成389行的loss,我有發現有時候訓練很不穩定,換完之後再訓練512的試看看: cnfd_loss=self._ConfidenceFocalLoss(pred_y,true_mask,ignore_mask,true_wht) 換成 cnfd_loss=self._ConfidenceLoss(pred_y,true_mask,ignore_mask,true_wht)